Задача математичного програмування Тема 1 Питання термінології, історіографія назв


називають критерієм або F-тестом Фішера



бет21/71
Дата27.03.2023
өлшемі3.01 Mb.
#471144
түріЗадача
1   ...   17   18   19   20   21   22   23   24   ...   71
Лекції Досл Операцій

називають критерієм або F-тестом Фішера (стосовно крокової регресії).
Доведено що дана статистика - є випадкова величина (сума ділити на суму ), розподілена за законом Фішера і її використовують для визначення порогу відсіву аргументів за значенням поліпшення дисперсії моделі.
Питання: А навіщо для визначення порогу відсіву аргументів розглядати відношення (*) а не просто поліпшення помилки або приріст ????.
- Резон в тому, що це відношення розподілено за відомим законом Фішера і для визначення складу аргументів моделі можливо застосувати механізм перевірки статистичних гіпотез:
При реалізації процедури включення аргументу - розглядається гіпотеза H0, що поліпшення якості моделі незначимо. Тобто Н0 полягає в тому, що введений аргумент – помилковий (не із складу істиних для цієї моделі) . Перевірка гіпотези H0 зводитися до послідовності дій:
1. Задаємося рівнем значущості , наприклад 0,01 або 0,05, що характеризує ризик прийняття неправильного рішення. Тобто ризик введення помилкового аргументу (ймовірність помилки 1 роду)
2. За спеціальними таблицями знаходимо -відсотковий точку розподілу Фішера зі ступенями свободи d1 = 1, d2 = n-k-2 (для формули (**) ступінь свободи визначається як d1 = (п-k) - (n-k-1) = 1). Це значення буде нашим пороговим для статистики (*).
Порівнюємо точку зі значенням розрахункової статистики . Якщо виявиться, що , то робиться висновок про значимість введеного ознаки і, відповідно, його слід включити в модель (віддається перевага гіпотезі H1 з ймовірністю помилитися ). Якщо ж , то приймається рішення про неефективність включення змінної в модель, тобто гіпотеза H0 приймається з імовірністю , що не суперечить експериментальним даним. Тут p(F) - щільність розподілу фішеровської випадкової величини.Чим вище (більше) поріг тим менше рівень значимості - ймовірність помилки 1 роду).
На рис. бачимо що зона допустимих розрахункових значень лежать вище (в сенсі справа) порога , а відповідна зона розрахункової помилки 1рода - (площа під хвостом)-повинна бути менше порогового рівня рівня значення помилки 1-ого роду - .
Таким чином задаючи в Stepwise = допустимо 0.05 (або відповідне значення ) -що є ймовірність включення помилкового аргументу ( ймовірність помилки 1 роду) ми цим параметром повністю визначаємо процедуру включення аргументів в модель.
Аналогічно при процедурі виключення аргументів з моделі розглядається гіпотеза H0, що погіршення якості моделі незначимо ( відповідно що аргумент помилковий). Відповідно обраний рівень значущості = допустимо 0.1 (або відповідний ) - є ймовірність виключення істинного аргументу (ймовірність помилки 2-го роду). Відповідно рішення про прийняття H0 "гіпотези про незначущість аргументу" - і виключення аргументу з моделі реалізується при виконанні умови . Тобто область допустимих для виключення значень лежить зліва від . І зачення порогу (чи ) повністью визачають процедуру виключення аргументів з моделі.
Тобто знання вірних значень порогів повністью визначають оптимальність моделі для даних конкретних умов моделювання (рівень кореляцій аргументів та шуми в даних). А які ж це значення?
Та класична теорія методу не дає відповіді на це запитання. Вона тілько скромно рекомендує значення по замовчуванню , , ,
*Комент:
Для практики: розширення полю змінних для одержання нелінійних по х моделей
Тема 6 . Проблеми методів структурної ідентифікації
Звернемо увагу на множник ( ) у формулі (-) для МSЕ який потрапляє у чисельник в статистиці Фішера (*). У форvулу вноситься корекція з кожним кроком алгоритму (k). Чим складніше модель (більше k ) тим більше коригується розрахункове значення критерію в сторону зменшення (тобто погіршення його значення) перешкоджаючи включенню аргументу в модель. Таким чином ми бачимо що навіть класичний КАБР вже використовував певну форму штрафу за складність моделі (через зміну значення ступеня свободи).
Правда його вплив при великих n незначний і практично не впливає на структуру моделі.

Інші проблеми КАБР:


1. Для конкретних умов шуму в даних (в Х і У) співвідношення і - своє, з точки зору найбільш точного прогнозу на свіжих даних, або, більш загально, з точки зору деякого "зовнішнього критерію "який ми визначаємо, як, "істина" для нас. В той же час, як сам алгоритм КАБР спирається лише на точність поточної навчальної вибірки і значення і пропонує вибирати нам.
2. Відомий недолік теорії статистичних гіпотез: тільки результат по введенню аргументу х (неухвалення H0 ) в ній вважається достовірним.
Результати по прийняттю H0 в загальному-то нічого не гарантують. Застосовується таке хітрозроблене формулювання - прийняття гіпотези H0 не суперечить вихідним даним.
Це приблизно так, якщо б у вас у дворі сьогодні вночі вбили двірника і звинуватили б в цьому Вас тільки на тій підставі, що ви спали удома один і нікому підтвердити Ваше алібі. (тобто твердження про те, що ви вбили двірника не протирічить даним слідства на цей час).
Це вірно, проте в цю ніч ще 200 тис киян спали одиноко - проте від цього висновок на обвинувачення Вас у вбивстві ви не змогли б заперечити, якби гіпотеза про звинувачення в убивстві приймалася тільки на тій підставі що вона не протирічить вхідним даним.
3.Крім того, зменшуючи (тобто збільшуючи поріг якості аргументу ) ми не тільки збільшуємо ймовірність правильного відкидання помилкового аргументу але і очевидно збільшуємо ймовірність відкидання разом з ним і істинного аргументу, тобто збільшуємо помилку другого роду - істинний аргумент теж може не проскочити занадто високий поріг ФІШЕРА ми збиваємо істинний аргумент заодно з хибним про всяк випадок. Моделі спрощуються, помилка її зростає …..
І магічне число зовсім не магічне, і в різних завданнях, при різних шумах і різних кореляціях істинних і хибних аргументів з виходом у (в деяких випадках кореляція хибного аргументу з виходом «у» буде вище за кореляцію істинного аргументу з виходом «у» - залежить від значення коефіцієнта при відповідному аргументі в моделі) це число має своє оптимальне значення - а яке ж воно ???? - проблема, проблема ….
Взагалі, оптимальне поєднання значень і ( та ) ключове невирішене питання КАБР від якого і залежить остаточна структура одержуваної моделі.
(замітимо тут, щоб не було путаниці: - ймовірність включити хибний аргумент, - це ймовірність не включення істинного аргументу на етапі включення, - ймовірність виключення істинного на етапі виключення).


Достарыңызбен бөлісу:
1   ...   17   18   19   20   21   22   23   24   ...   71




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет