- Исходя из приведенного выше, можно утверждать, что на интервале с границами
- содержится, по крайней мере, 3/4 всех данных (75%).
- На интервале с границами
- содержится, по крайней мере, 8/9 всех данных (89,9%).
- Это выполнено для любого распределения!!!
Стандартное отклонение для нормального закона Коэффициент вариации - Коэффициент вариации вычисляется как отношение стандартного отклонения к среднему:
- Коэффициент вариации полезен, если:
- 1. Сравниваются несколько совокупностей, измеряемых в разных величинах.
- 2. Сравниваются совокупности, измеряемые в одинаковых величинах, но имеющие сильно отличающиеся средние.
Пример для коэффициента вариации - Какие данные имеют большую вариацию:
- имеющие стандартное отклонение 20 при среднем 200 или
- имеющие стандартное отклонение 3 при среднем 30?
- Ответ. Коэффициенты вариации равны. Вариация одинакова.
- Выбросы
- Вид распределения
Разделы исследовательского анализа данных - Исследовательский анализ данных - Exploratory Data Analysis (EDA) представляет собой применение статистических методов для представления, упорядочения данных и понимания их важнейших характеристик.
- Основными разделами анализа являются:
-
- 1. Центральная тенденция. Вычисление и анализ среднего, моды, медианы.
- 2. Стандартное отклонение. Нахождение дисперсии, стандартного отклонения.
- 3. Квартили. Минимум, максимум, размах, нахождение квартилей.
- 4. Выбросы. Нахождение и анализ выбросов.
- 5. Форма распределения. Асимметрия и куртозис.
Выбросы - Расширенная коробковая диаграмма строится с анализом выбросов. Для этого необходимо знать разброс квартилей IQR.
- Умеренные выбросы изображаются темными точками и удалены ниже первой квартили или выше третьей от 1,5 IQR, но не более 3 IQR.
- Экстремальные выбросы изображаются светлыми точками и удалены ниже первой квартили или выше третьей более 3 IQR.
Достарыңызбен бөлісу: |