9 – СЫЗЫҚТЫҚ РЕГРЕССИЯ МОДЕЛІ
Егер қандай да бір бақылау нүктелерінің «бұлты» берілсе, онда осы нүктелер жиынына «ең жақын» болатын түзуді анықтау керек. Әдетте, жақындылық критерийі ретінде тәуелді айнымалының нақты мәндері уі-мен регрессия теңдеуі бойынша есептелген теориялық мәндердің айырмасының қосындыларының квадратының минимумы алынады:
(9.1)
мұндағы y xi=a+b xi регрессия теңдеуі бойынша есептелген мәндер; хi,уi-бақылау деректері; а,b-белгісіз параметрлер.
S (a, b) функциясы үздіксіз, дөңес және төменгі жағынан нөлмен шектелген, яғни минимумы бар функция. (9.1) әдісті ең кіші квадраттар әдісі (ЕКӘ) деп атайды.
Жұптық сызықтық регрессия параметрлерін анықтаудың жағын қарастырайық. Х пен У арасындағы байланыс сызықтық болсын:
(9.2)
Бұнда байланыс Х пен У-тің жалпы жиынтықтарының арасындағы байланыс болады. Бірақ У-ке басқа да ескерілмеген факторлар әсер етеді және өлшеу қателіктері де болуы мүмкін.
Демек, және тәжірибелік деректер арасындағы байланыс төмендегідей болады:
(9.3)
мұндағы - кездейсоқ қателіктер (ауытқулар).
Енді біздің алдымызда мынадай есеп тұр: тәжірибелік деректер хi,уi бойынша S шамасына min әкелетіндей және параметрлерін бағалау керек.
Егер ауытқуларының дәл мәндері белгілі болса, онда сызықтық формула тура болған жағдайда және параметрлерінің мәнін есептеуге болатын еді. Бірақ кездейсоқ ауытқулардың іріктемедегі мәндері белгісіз, сондықтан хi,уi бақылау мәндері бойынша тек және бағалауын таба аламыз. Бұл бағалаулар кездейсоқ болады, себебі кездейсоқ іріктемеге сәйкес келеді.
a және b сәйкес және параметрлерінің бағалауы болсын. Онда бағалаған регрессия теңдеуі
(9.4)
мұндағы сәйкес қателіктерінің тәжірибелік мәндері.
Ең кіші квадраттар әдісі бойынша табылған a және b бағалаулары керекті қасиеттерге ие болуы үшін, мынадай шарттар орындалады дейік:
1) шамалары–кездейсоқ айнымалылар;
2) қателіктерінің математикалық күтуі нөлге тең, яғни М =0;
3) қателіктерінің дисперсиясы тұрақты шама, яғни
4) қателіктері өзара тәуелсіз, яғни
5) қателіктері қалыпты үлестірімге ие болады, яғни
Егер (9.1)-(9.4) шарттары орындалса, онда ең кіші квадраттар әдісі бойынша табылған бағалар мынадай қасиеттерге ие болатыны теориядан белгілі:
а) Бағалар ауытқымаған, яғни
Бұл қасиет M =0 шартынан шығады, яғни бағалау барысында жүйелік қателіктер болмайды.
б) Бағалар тиянақты, яғни бақылау саны өскен сайын бағалар дисперсиясы 0-ге ұмтылады:
Басқаша айтқанда, n өскен сайын бағалар шындылығы өседі.
в) Бағалар тиімді, яғни бұл параметрлердің кез келген y бойынша сызықты бағаларының ішінде ең кіші дисперсияға ие болады.
(4.5) шарт бағаларының статистикалық шындылығын тексеру үшін қолданылады. Бұл шарт орындалғанда, бағалар барлық ауытқымаған бағалар ішінде ең кіші дисперсияға ие болады.
Енді a және b бағаларын (4.1)-ден табайық.
функциясы минимумге жетуі үшін, дербес туындыларын 0-ге теңестіру керек.
(9.5)
Бұдан
(9.6)
(4.6) – жүйенің әрбір теңеуін -ге көбейтсек:
(9.7)
Бұдан
(9.8)
b коэффициенті табудың мынадай формулалары да бар:
(9.9)
Регрессия коэффициенті b-ны тексеру үшін төмендегі теңсіздік орындалуы керек:
(9.10)
Мұндағы, b-ның стандарт ауытқуы, - Стьюденттің t үлестірімі.
Ескере кететін жай, егер корреляция коэффициенті r шын болса, онда регрессия коэффициенті b-да шын болады.
Функционалдық тәуелділік - бір өзгермелінің мағынасына басқа өзгермелінің анықталған мағынасының сай келуі.
Экономикада көп жағдайда өзгермелілердің өлшемдерінің арасында тәуелділік кездеседі, бұл дегеніміз бір өзгермелінің мағынасына өзге өзгермелінің нақты анықталмаған көптеген мүмкін мағынасының біреуінің сай келуі. Басқа сөзбен айтқанда, бір өзгермелінің әр мағынасына өзге өзгермелінің шартты анықталған мағынасы сай келеді. Мұндай тәуелділік статистикалық (не стохастикалық, ықтималдық) тәуелділік деп аталады.
Статистикалық байланыс ұғымы, тәуелді өзгермелі бақылауға алынбаған немесе ескерілмеген факторлардың ықпалына душарлығымен, өзгермелілердің мағыналарын өлшеуде түрлі қателердің кездесуімен шартталады.
Егер екі өзгермелі арасындағы тәуелділік бір өзгермелінің әр мағынасына өзге өзгермелінің анықталған шартты математикалық күтуі (орташа) сай келсе, онда мұндай тәуелділік корреляциялық тәуелділік деп аталады.
Басқа сөзбен, екі өзгермелінің арасындағы корреляциялық тәуелділік деп бір өзгермелінің мағынасы мен өзге өзгермелінің шартты математикалық күтудің арасындағы функционалдық тәуелділікті айтамыз.
Коррелияциондық тәуелділік былайша бейнеленеді:
Мх(У) = φ(х) (1)
немесе
Му(Х) = ψ(у)
мұндағы φ(х) ≠ const, ψ(у) ≠ const.
Регрестік талдауда У өзгермелінің Х кездейсоқ тәуелсіз өзгермеліден біржақты тәуелділік қарастырылады. Мұндай тәуелділік регрессиялық тәуелділік деп аталады. Сонымен қатар У тәуелді өзгермеліні үн қату функциясы, түсіндірмеді, шығыс, қорытынды, эндогенді өзгермелі, нәтижелі белгі деп, ал Х тәуелсіз өзгермеліні - түсіндірмелі, кірме, алдын-ала болжалдық, экзогенді өзгермелі деп атайды.
(1) теңдігі регрессияның модельді теңдігі, ал функция φ(х) – регрессия функциясының моделі, ал оның графигі – регрессияның модельді сызығы деп аталады.
Регрессия теңдігін нақты суреттеу үшін, егер У үшін Х өзгермелі х мағынаны қабылдау шарты орындалса, яғни Х =х, У тәуелді өзгермелінің шартты үлестіру заңын білу қажет. Статистикалық тәжірибеде мұндайды алу қолдан келмейді, негізінде зерттеуші тек n шектеулі көлемнің (хi,уi) жұп мәнін ғана қолдана алды. Олай болса регрессия функциясын сұрыптау бойынша бағалау туралы әңгіме болуы мүмкін. Мұндай бағалау болып, регрессияның таңдамалы сызығы болуы мүмкін:
ý= φ (х, b0,b1,...bp) (2)
мұндағы ý- өзгермелі Х=х мағына болған жағдайындағы, У өзгермелінің шартты ортасы, b0,b1,...bp – қисықтың параметрлері. (2) теңдігі сұрыпталған регрессия теңдігі деп аталады.
Бақылау сұрақтары:
Сызықтық регрессия дегеніміз не?
ЕККӘ мәнісі неде?
ЕККӘ регрессияны есептеу
Достарыңызбен бөлісу: |