ТЕМА. Числовые характеристики выборки
Следующим этапом обработки данных является вычисления числовых характеристик выборки. Главные из них: среднее значение, дисперсия, среднее квадратическое значение, моменты.
Так как функцию выборочных значений называют статистикой, то числовые характеристики, вычисленные по выборке, также называют статистиками.
Числовые характеристики, вычисленные по генеральной совокупности, называют параметрами генеральной совокупности.
7.1 Выборочное среднее
Для конкретной выборки объема n ее выборочное среднее определяется соотношением
где хi – значение элемента выборки.
Обычно требуется описать статистические свойства произвольных случайных выборок одного объема, а не одной из них. Это значит, что рассматривается математическая модель, которая предполагает достаточно большое количество выборок объема n. В этом случае элементы выборки рассматриваются как независимые случайные величины Хi, принимающие значения хi с одной и тоже плотностью вероятностей f(x), являющейся плотностью вероятностей генеральной совокупности. Тогда выборочное среднее также является случайной величиной , равной
Среднее значение генеральной совокупности, из которой производится выборка, будем называть генеральным средним и обозначать mх. При значительном объеме выборки можно ожидать, что выборочное среднее не будет заметно отличаться от генерального среднего. Поскольку выборочное среднее является случайной величиной, то для нее можно найти математическое ожидание:
Таким образом, математическое ожидание выборочного среднего равно генеральному среднему. В этом случае говорят, что выборочное среднее является несмещенной оценкой генерального среднего. В дальнейшем мы вернемся к этому термину. Так как выборочное среднее является случайной величиной, флуктуирующей вокруг генерального среднего, то желательно оценить эту флуктуацию с помощью дисперсии выборочного среднего. Рассмотрим выборку, объем которой n значительно меньше объема генеральной совокупности N (n <<N). Предположим, что при формировании выборки характеристики генеральной совокупности не меняются, что эквивалентно предположению N = ¥. Тогда
Случайные величины Хi и Xj (i¹j) независимы, следовательно,
Подставим полученный результат в формулу для дисперсии:
, где – дисперсия генеральной совокупности. Тогда среднее квадратическое отклонение выборочного среднего равно:
.
Из этой формулы следует, что с увеличением объема выборки флуктуации среднего выборочного около среднего генерального уменьшаются как . Проиллюстрируем сказанное примером. Пусть имеется случайный сигнал с математическим ожиданием и дисперсией, соответственно равнымиmx = 10, = 9.
Отсчеты сигнала берутся в равноотстоящие моменты времени t1, t2, ... , tn.
Так как отсчеты являются случайными величинами, то будем их обозначать X(t1), X(t2), ... , X(tn).
Определим количество отсчетов, чтобы среднее квадратическое отклонение оценки математического ожидания сигнала не превысило 1% его математического ожидания. Поскольку mx=10, то нужно, чтобы С другой стороны поэтому или Отсюда получаем, что n ³ 900 отсчетов.
Достарыңызбен бөлісу: |