Зауваження: щоб уникнути зациклення процесу включення-виключення аргументів значимість включення встановлюється менше значущості виключення або
У КАБР для відбору кращих структур використовують пороги критерію якості моделі, , (пов'язані з рівнем значущості) і корекцію формули розрахунку критерію якості моделі, що враховує штраф за складність моделі.
Підхід має суттєвий недолік в тому сенсі, що не формалізує очевидним чином вибір порогів в залежності від умов моделювання (дисперсія і параметри шуму, ступінь коррелированности входів і тд).
А механізм штрафів за складність, який використовується - слабо чутливий до умов моделювання при великих і середніх значеннях n –кількості точок (див нижче – на початку теми 6)
Розрахунок критерію: статистика Фішера (F тест)
Залишається привести формулу розрахунку статистики Фішера (F тесту) який був створений для порівняння і висновків про відмінність дисперсій. введемо позначення
• - сума квадратів помилок ,
тут - спостережувані значення, - значення моделі
• - середньоквадратична помилка (-)
Формула залежить від кроку застосування її в алгоритмі, тут - кількість точок, - кількість оцінюваних параметрів моделі, - число ступенів свободи моделі,
У формулі для ступеню свободи маємо (-2) тому, що віднімається кількість зв’зків що застосовано у моделі: враховується ще вільний член моделі і одна ступінь свободи у середнього .
- сума квадратів центрованої регресії.
Розглядається така формула до введення регресору х-претендента в модель, тобто та після введення регресорів х-претендента в модель і їх різниця
(**)
Найгірша модель (сама простамодель) – це і відповідне значення для цього випадка .
По мірі покращення моделі при введенні корисного аргументу, сума квадратів центрованої регресії збільшується і прагне до значення
Тому аргумент з більшим приростом - краще. Відповідно розглядаються і - значення середньоквадратичної помилки до і після введення регресорів в модель
Тоді статистику (*)
Достарыңызбен бөлісу: |