! Примечание: во многих источниках используют понятие квантиля распределения, который рассчитывается для вероятности , но чтобы не разводить путаницу я буду придерживаться прежней схемы решения.
Теперь нужно вычислить наблюдаемое значение критерия . Если оно попадёт в область принятия гипотезы (незаштрихованный участок на рисунке ниже), то на уровне значимости нет оснований отвергать гипотезу . Если же ( либо – красный штрих), то нулевая гипотеза отвергается:
Проводим вычисления:
, таким образом, на уровне значимости гипотезу отвергаем в пользу гипотезы .
Иными словами, выборочное значение оказалось статически значимым и вряд ли объяснимо случайными факторами (малой выборкой, например).
При этом с вероятностью 0,05 мы совершили ошибку первого рода, то есть отвергли правильную гипотезу. Как видите, эта вероятность мала, а посему, уважаемые студенты, поменьше прогуливайте занятия, ибо статистическая проверка всего лишь по 8 студентам – и то – убедительно подтвердила падение успеваемости.
2) Теперь определим доверительный интервал для генерального линейного коэффициента корреляции .
Очевидно, что генеральный коэффициент может быть как меньше, так и больше выборочного результата . И задача состоит в том, чтобы найти интервал , который с заранее заданной доверительной вероятностью (надёжностью) накроет истинное значение генерального коэффициента :
Выберем популярное значение .
И тут развилка. Если выборка малА (ориентировочно ), то целесообразно использовать то же распределение Стьюдента с количеством степеней свободы . Это наш случай, и точность оценки в нём рассчитывается по формуле:
Для уровня доверительной вероятности и количества степеней свободы находим коэффициент доверия: , например, с помощью Расчётного макета (пункт 10б).
! Примечание: также можно использовать значение и пункт 10в макета.
Таким образом:
и получается следующий интервал:
Поскольку коэффициент корреляции не может превосходить по модулю единицу, то левое значение корректируем:
– итак, с вероятностью данный интервал накрывает генеральный коэффициент корреляции .
Да, оценка весьма грубА, но, так или иначе, задание выполнено. И, как вы правильно догадались, виновником такого результата является слишком малый объём выборки. Это хорошо видно и по формуле: – при увеличении знаменатель растёт и, соответственно, уменьшается.
Из формулы также нетрудно понять, что чем ближе выборочный коэффициент по модулю к единице, тем точнее будет оценка. Так, для и того же значения получается интервал , что уже очень и очень неплохо.
Интервал можно сузить, уменьшив доверительную вероятность , однако это неприемлемо для серьезного статистического исследования. Поэтому остаётся лишь увеличивать объём выборки, и случай я разберу в следующей задаче. Там всё занятнее, но зато точнее.
3) Проверим значимость коэффициентов выборочного уравнения линейной регрессии . Иными словами, можно ли доверять значениям или они далеки от соответствующих коэффициентов генерального уравнения ?
Наиболее важным является коэффициент «а» при факторной переменной, с него и начнём. По исходным данным (количество прогулов) и (соответствующая суммарная успеваемость) заполним следующую расчётную таблицу:
Достарыңызбен бөлісу: |