21. Проверка значимости коэффициента корреляции, коэффициентов и уравнения линейной регрессии. Доверительные интервалы



бет3/7
Дата18.01.2024
өлшемі200.05 Kb.
#489287
түріУрок
1   2   3   4   5   6   7
матстатистика 21

! Примечание: во многих источниках используют понятие квантиля распределения, который рассчитывается для вероятности  , но чтобы не разводить путаницу я буду придерживаться прежней схемы решения.
Теперь нужно вычислить наблюдаемое значение критерия  . Если оно попадёт в область принятия гипотезы  (незаштрихованный участок на рисунке ниже), то на уровне значимости  нет оснований отвергать гипотезу  . Если же  ( либо  – красный штрих), то нулевая гипотеза отвергается:

Проводим вычисления:
, таким образом, на уровне значимости  гипотезу  отвергаем в пользу гипотезы  .
Иными словами, выборочное значение  оказалось статически значимым и вряд ли объяснимо случайными факторами (малой выборкой, например).
При этом с вероятностью 0,05 мы совершили ошибку первого рода, то есть отвергли правильную гипотезу. Как видите, эта вероятность мала, а посему, уважаемые студенты, поменьше прогуливайте занятия, ибо статистическая проверка всего лишь по 8 студентам – и то – убедительно подтвердила падение успеваемости.
2) Теперь определим доверительный интервал для генерального линейного коэффициента корреляции  .
Очевидно, что генеральный коэффициент  может быть как меньше, так и больше выборочного результата  . И задача состоит в том, чтобы найти интервал  , который с заранее заданной доверительной вероятностью (надёжностью)  накроет истинное значение генерального коэффициента  :

Выберем популярное значение  .
И тут развилка. Если выборка малА (ориентировочно  ), то целесообразно использовать то же распределение Стьюдента с количеством степеней свободы  . Это наш случай, и точность оценки в нём рассчитывается по формуле:

Для уровня доверительной вероятности  и количества степеней свободы  находим коэффициент доверия:  , например, с помощью Расчётного макета (пункт 10б).
! Примечание: также можно использовать значение  и пункт 10в макета.
Таким образом:

и получается следующий интервал:

Поскольку коэффициент корреляции не может превосходить по модулю единицу, то левое значение корректируем:
итак, с вероятностью  данный интервал накрывает генеральный коэффициент корреляции  .
Да, оценка весьма грубА, но, так или иначе, задание выполнено. И, как вы правильно догадались, виновником такого результата является слишком малый объём выборки. Это хорошо видно и по формуле:  – при увеличении  знаменатель растёт и, соответственно,  уменьшается.
Из формулы также нетрудно понять, что чем ближе выборочный коэффициент по модулю к единице, тем точнее будет оценка. Так, для  и того же значения  получается интервал  , что уже очень и очень неплохо.
Интервал можно сузить, уменьшив доверительную вероятность  , однако это неприемлемо для серьезного статистического исследования. Поэтому остаётся лишь увеличивать объём выборки, и случай  я разберу в следующей задаче. Там всё занятнее, но зато точнее.
3) Проверим значимость коэффициентов выборочного уравнения линейной регрессии  . Иными словами, можно ли доверять значениям  или они далеки от соответствующих коэффициентов генерального уравнения  ?
Наиболее важным является коэффициент «а» при факторной переменной, с него и начнём. По исходным данным  (количество прогулов) и  (соответствующая суммарная успеваемость) заполним следующую расчётную таблицу:



Достарыңызбен бөлісу:
1   2   3   4   5   6   7




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет