Адекватність (статистична значимість) отриманого рівняння регресії
Для перевірки значимості рівняння регресії "в цілому" використовується критерій Фішера, як
статистики (*)
Якщо (*) виконується, то рівняння регресії адекватно (статистично значимо) описує результати експерименту при ( ) - процентному рівні значущості.
Відошення - повної і - залишкової дисперсій:
показує, у скільки разів рівняння регресії аппроксимує завдання краще, ніж середнє , де k - сума числа вхідних змінних плюс вільний член.
Необхідно пам'ятати, що довірча оцінка відхилення емпіричної лінії регресії від теоретичної різко погіршується в міру віддалення від середнього значення . Зокрема, з цієї причини небезпечна екстраполяція емпіричної регресійної залежності за межі інтервалу вхідних змінних , для якого вона отримана. По суті це означає що заздалегідь визнається непрацездатність моделі на нових свіжих даних, якщо вони по суті не повторюють старі !!!!!
І цей аргумент у нас буде одним з головних в критиці, тому що, якщо в алгоритмі немає серйозних механізмів настройки структури моделі, то вона буде безпорадна в реальних умовах застосування на живих даних. Відзначимо, де в цьому механізмі відсіву засвітився штраф за складність моделі в явному вигляді.
Це варіант розрахунку середньоквадратичної помилки в даній версії F-критерію з корекцією на складність моделі k (k - кількість параметрів, тобто і аргументів, які увійшли в модель)
Оскільки MSЕ в F-критерії стоїть у знаменнику то збільшення MSЕ призводить до погіршення критерію - це і є явний штраф за складність моделі.
Однак при істотних відмінностях n та k штраф практично не грає ролі у виборі структури, тому в класичних КАБР застосовується додатково пороговий механізм відбору структури моделі.
Більш жорстко штрафують за складність пороги Fвкл і Fвикл, однак класична версія КАБР не передбачає отімізацію даних параметрів алгоритму. Механізм визначення значень Fвкл і Fвикл, був розроблений пізніше (з 1976 р) в рамках української школи теорії самоорганізації академіка А.Г. Івахненко (теорії методу групового урахування аргументів - МГУА). Ця школа стала родоначальником теорії індуктивного моделювання.
Не викладаючи подробиць обґрунтування, намітимо лише грубий алгоритмічний рецепт для вирішення проблеми визначення значення порогів.
Пропонується з робочою вибірки даних W виділяти (рівномірно по дисперсії) тестову подвиборку B, потужністю 20-30% від W. Решта 70-80% називають навчальною вибіркою A. Тоді, створивши доцільну сітку значень Fвкл і Fвикл на навчальній вибірці одержують різні моделі претенденти, а найкращу модель (з відповідними Fвкл * і Fвикл *) визначають за значенням найменшої помилки (найбільшого коефіцієнта детермінації) на тесті (вибірці В). В рамках іделогіі КАБР можуть бути запропоновані й більш ефективні схеми оптимізації. В курсі "Біомедичної кібернетики" пізніше ми розглянемо механізми штрафів (критерії) які більш чутливо і обґрунтовано реагують на ускладнення моделі. Розглянутий вище апарат ми будемо використовувати в РГР для отримання
1.Моделей критеріїв, використовуваних для визначення функціоналу оптимізаційних задач (ОЗ), і
2.Моделей станів біологічних об'єктів, що використовуються для формування обмежень ОЗ.
Достарыңызбен бөлісу: |