Примечание: поскольку , то фактически мы провели те же вычисления, что и в первом пункте.
Вывод: коэффициент статистически значим.
Для проверки значимости коэффициента выдвигаем гипотезу о равенстве нулю соответствующего коэффициента генерального уравнения . Конкурирующая гипотеза стандартна:
Критерий аналогичен: , где – выборочное значение коэффициента, а – стандартная ошибка этого коэффициента.
Уровню значимости и количеству степеней свободы соответствует то же значение и те же области:
Стандартную ошибку коэффициента«бэ» рассчитаем через стандартную ошибку коэффициента «а»:
(сумма найдена в Примере 69) Вычислим наблюдаемое значение критерия:
– данное значение попало в область принятия гипотезы , поэтому на уровне значимости нет оснований отвергать гипотезу .
Вывод: коэффициент статистически не значим и его отличное от нуля значение, вероятнее всего, обусловлено статистической погрешностью выборки.
Таким образом, генеральное уравнение регрессии с высокой вероятностью имеет вид и самый что ни на есть реалистичный смысл: если стоимость фондов равна нулю , то суточная переработка сырья тоже нулевая.…Хотя, может статься, при нулевой балансовой стоимости сырьё начинают потихоньку разворовывать, и отрицательное значение вовсе не случайно :) Кроме шуток, следует заметить, что на каких-то предприятиях это может и так, но статистическая проверка показала, что данный факт не характерен для всей генеральной совокупности.
4) Найдём доверительные интервалы для генеральных коэффициентов и .
Для коэффициента при факторной переменной:
– данный интервал с доверительной вероятностью накрывает истинное значение генерального коэффициента .
Обратите внимание, что интервальная оценка получилась гораздо более качественной, нежели в предыдущем примере – вот что значит бОльший объём выборки. Но интервал, конечно, всё равно широк.
И доверительный интервал для свободного члена:
– данный интервал с вероятностью накрывает истинное значение генерального коэффициента
Да, оценка тривиальна, но примечательно, что ноль вошёл в эту область, и интервал получился почти симметричным относительно нуля.
5) Проверим статистическую значимость всего выборочного уравнения , а значит, выборочного коэффициента детерминации .
Напоминаю, что эта проверка эквивалентна проверкам пунктов 1 и 3, и её технический алгоритм ничем не отличается от предыдущей задачи.
Проверим гипотезу – о том, что генеральный коэффициент детерминации равен нулю, то есть, стоимость основных фондов вообще никак (на 0%) не влияет на суточную переработку сырья. И естественная альтернатива , состоящая в том, что такое влияние есть.
Для проверки гипотезы используем случайную величину (статистический критерий) , которая имеет распределение Фишера ( -распределение) с количеством степеней свободы .
Для уровня значимости и количества степеней свободы с помощью соответствующей функции Экселя (пункт 12) определяем критическое значение критерия:
Если окажется, что наблюдаемое значение критерия (красный цвет), то гипотезу на уровне значимости отвергаем, если , то отвергать её – оснований нет:
В нашем случае:
, таким образом, на уровне значимости гипотезу отвергаем в пользу конкурирующей гипотезы .
Вывод: выборочное уравнение и коэффициент детерминации статически значимы. Линейная корреляционная модель подобрана удачно (для описания зависимости суточной переработки сырья от стоимости основных фондов).
6) С помощью выборочного уравнения получим точечный прогноз суточной переработки сырья при стоимости основных фондов в млрд. руб.:
тыс. ц.
Определим доверительный интервал , который с доверительной вероятностью накроет истинное прогнозное значение , полученное с помощью генерального уравнения . И, как мы выяснили, кстати, свободный член этого уравнения, с точки зрения статистики, равен нулю .
Используем формулу , где – коэффициент доверия, а – стандартная ошибка точечного прогноза.
И этот коэффициент доверия нам уже хорошо известен из предыдущих пунктов: – для доверительной вероятности и количества степеней свободы .