Цели - После того, как мы познакомились с основными способами представления данных, изучим числовые характеристики, которые позволяют анализировать выборку и делать некоторые выводы.
3.1. Измерение центральной тенденции Постановка задачи - Измерение центральной тенденции (measure of central tendency) состоит в выборе одного числа, которое наилучшим образом описывает все значения признака из набора данных. Такое число называют центром, типическим значением для набора данных, мерой центральной тенденции.
- Зачем?
- Получим информацию о распределении признака в сжатой форме.
- Сможем сравнить между собой два набора данных (две выборки).
- Минус: ведет к потере информации по сравнению с распределением частот.
Мода - Мода – наиболее часто встречающееся значение в выборке, наборе данных. Обозначается Мо.
- Выборка: 5,4 1,2 0,42 1,2 0,48 Мода=1,2
- Для данных, расположенных в таблице частот, мода определяется как значение, имеющее наибольшую частоту.
Одна ли мода? - Если наибольшую частоту имеет два значения выборки, выборочное распределение называется бимодальным.
- Если наибольшую частоту имеет более двух значений выборки, выборочное распределение называется мультимодальным.
- Если ни одно из значений не повторяется, мода отсутствует.
Свойства моды - 1. Наличие одного или двух крайних значений, сильно отличающихся от остальных, не влияет на значение моды.
- 2. Мода совпадает с точкой наибольшей плотности данных.
- 3. Мода может иметь несколько значений.
- 4. Мода может существовать для всех типов данных. Единственная мера, которая работает в номинальной шкале!
Достарыңызбен бөлісу: |