21. Проверка значимости коэффициента корреляции, коэффициентов и уравнения линейной регрессии. Доверительные интервалы


Но насколько можно доверять полученным результатам?



бет2/7
Дата18.01.2024
өлшемі200.05 Kb.
#489287
түріУрок
1   2   3   4   5   6   7
матстатистика 21

Но насколько можно доверять полученным результатам? Ведь перед нами выборка, причём, выборка малого объёма.
Решение, а точнее, небольшое исследование:
1) Проверим значимость выборочного коэффициента корреляции  . Для этого рассмотрим нулевую гипотезу:
– генеральный линейный коэффициент корреляции равен нулю, то есть успеваемость всех студентов не зависит от количества прогулов (линейно корреляционно).
Под словечком «всех» кроется изучаемая генеральная совокупность – можно рассмотреть студентов какого-то конкретного ВУЗа, либо студентов региона, либо студентов-приматов целой страны, либо вообще всех студентов на планете. Но здесь явно нет претензий на масштаб (выборка всего лишь 8 человек) – предположим, что исследуется успеваемость студентов вашего факультета.
В качестве альтернативной гипотезы стандартно рассматривают противоположное утверждение  – о том, что линейная корреляционная зависимость успеваемости от количества прогулов существует. При этом направление зависимости (прямая или обратная) не принимается во внимание, поскольку категоричному утверждению о равенстве нулю логично противопоставить и положительные значения  . Ну а вдруг это факультет вундеркиндов, где прогулы только повышают успеваемость?
Заметьте заодно, что это один из немногих случаев, когда нулевая гипотеза является менее правдоподобной, нежели альтернативная.
Алгоритм проверки гипотезы работает по стандартному трафарету, который мы неоднократно использовали ранее. Сначала нужно задать уровень значимости, коль скоро он не предложен в условии. Возьмём традиционное значение  .
Для проверки гипотезы  на уровне значимости  используем статистический критерий  , где  – объём выборки, а  – выборочный коэффициент корреляции. Напоминаю, что статистический критерий – есть величина случайная. Почему? В данном случае потому, что в разных выборках мы будем получать разные значения  . Эта случайная величина имеет распределение Стьюдента с количеством степеней свободы  , где «эм» – количество оцениваемых параметров. Здесь пациент один (коэффициент корреляции):  , а посему  .
Чтобы проверить нулевую гипотезу, нужно найти критическое значение  двусторонней критической области – для уровня значимости  и количества степеней свободы  . В нашем случае  и:
– это значение можно определить по таблице критических точек распределения Стьюдента (ориентируемся по верхней строке) либо с помощью соответствующей функции Экселя (пункт 10в).


Достарыңызбен бөлісу:
1   2   3   4   5   6   7




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет