Қазақстан республикасының денсаулық сақтау министрлігі



бет7/10
Дата17.07.2016
өлшемі3.68 Mb.
#205156
1   2   3   4   5   6   7   8   9   10

РЕГРЕССИЯЛЫҚ ТАЛДАУ


Медициналық-биологиялық зерттеулерде өзара байланысқан көрсеткіштермен жұмыс істеуге жиі тура келеді. Екі немесе бірнеше көрсеткіштер арасындағы байланыс жиі көрінбей қалады, басқа себепредің (факторлардың) әсерінен қабаттасып күрделене түседі. Бір көрсеткіштің өзгерісі екінші (немесе бірнеше) көрсекіштің өзгерісіне қаншалықты тәуелді екендігін зерттеу – статистиканың маңызды мақсаттарының бірі.

Байланыстар функционалды және корреляциялық болып бөлінеді. Бір айнымалының әрбір мәніне басқа айнымалының тек нақты бір мәніне сәйкес келетін функционалды тәуелділікке қарағанда, (х) айнымалының әрбір мәніне басқа (у) айнымалының бірнеше мәндері сәйкес келетін (басқа себептердің қабаттасуына байланысты) тәуелділікті корреляциялық деп атайды. Корреляциялық тәуелділік тек көпшілікті бақылау негізінде алынады. Корреляциялық тәуелділік мысалы ретінде пациент қанындағы А затының құрамының енгізілетін В дәрмегінің мөлшеріне тәуелділікті алуға болады.

Корреляциялық тәуелділіктің ең қарапайым түрі – жұп корреляция, яғни екі белгі арасындағы тәуелділік (нәтижелілік және факторлы).

Корреляциялық тәуелділіктерді зерттеу кезіндегі статистиканың негізгі мақсаттары.

Бұлар:


1) у-тің х-ке тәуелділігін сипаттайтын математикалық формуланы табу;

2) осындай тәуелділіктің тарлығын өлшеу.

Бірінші есепті шешу, яғни теңдеу параметрлерін табумен байланысты байланыс формасын анықтау, байланыс теңдеуін (регрессия теңдеуі) табу деп аталады. х функциясы деп қарастырылатын көрсеткіштер ух деп белгіленеді .

y-тің x-ке регрессия теңдеуі деп тәуелсіз х айнымалысы мен у тәуелді айнымалысының мәндері арасында тәуелділік орнататын у = f (х) түріндегі теңдеуді айтады.

Байланыстың түрлі формалары бар:

1) түзусызықты:

2) қисықсызықты:

а) екінші ретті парабола:

б) гипербола: : және т.б.

Сызықтық регрессияны қарастырайық. Ең қарапайым болып сызықтық функция алынады, оның түрі:



y = b0 + b1x

b0 және b1 - тұрақты коэффициенттер (5 сурет).

5 Сурет – Салмақ пен бойының көрсеткіштері арасындағы байланысты көрсететін регрессия сызығы

Регрессия теңдеуінің коэффициенттерін есептеу ең қолайлысы әдісі кіші квадраттар әдісі болып табылады, ол регрессия түзуі зерттелетін шамалар арасындағы байланысты ең жақсы түрде көрсетуге мүмкіндік беретін b0 және b1 коэффициенттерін таңдауға көмектеседі (6 сурет).

6 Сурет - Кіші квадраттар әдісі

Графиктен көретініміздей, нақты мәндер мен теңдеу арқылы алынған мәндер қандай да бір шамаға өзгеше (яғни қандай да ауытқу бар). Барлық ауытқулардың суммасы минималды болтындай түзуді таңдау қажет.

Сызықтық тәуелділік кезінде:




КОРРЕЛЯЦИЯЛЫҚ ТАЛДАУ


Статистиканың маңызды бөлімдерінің бірі корреляциялық талдау болып табылады. Корреляция түсінігі алдымен вариациялық қатарлар арасындағы байланыстың көрнекілік дәрежесін сипаттайды. Көрнекілік үшін бұл байланысты графикалық түрде көрсетуге болады. Координаталық жазықтықта абсциссалар осімен вариациялық қатардың біреуінің мәндерін, ал ордината осімен басқасының мәндерін салып шығады. Координаталық жазықтықтағы осындай нүктелердің жиынтығын (олардың саны бақылаулар санына тең) корреляцияның жалпы суретін құрады және әдетте екі вариациялық қатарды (регрессиялық қатар) құрайтын параметрлердің өзара тәуелділігінің қандай да бір орташаланған қисығын (әдетте түзуді) салуға мүмкіндік береді. Практикада зерттеушіні бір айнымалының екінші айнымалыға тәуелділігі емес, осы айнымалылар арасындағы байланыстың тығыздығының санмен көрсетуге болатын сипаттамасы қызықтыруы мүмкін. Бұл сипаттама корреляция коэффициенті деп аталады. Корреляциялық талдау жағдайында қарастырылатын екі вариациялық қатар біз үшін тең құқылы.

Егер х пен у кездейсоқ шамалар қалыпты тарамдалса, олардың сызықтық байланысының күшін Пирсон корреляция коэффициенті арқылы есептеуге болады;



Есептелген корреляция коэффициенті жиынтықтың генеральды корреляция коэффициентінің таңдамалы бағасы болып табылады, яғни, кез келген кездейсоқ шама сияқты mг қатесі бар. Сол себепті корреляция жоқтығы туралы болжамды тексеру керек. Болжамдарды тұжырымдамасын жасайық:

Н0 - r=0 (айнымалылар арасында байланыс жоқ)

Н1 - r.≠0

α мәнділік деңгейін берейік.

Критерий статистикасы келесі теңдік болып табылады:



мұндағы t - (п-2) бостандық дәрежелі Стьюдент тарамдалуы бар статистика. Егер t сенімділіктің берілген деңгейінің критикалық мәнінен үлкен болса, онда нольдік болжам қабылданбайды.

Корреляция коэффициенті келесі аралықта орналасады: -1 ≤ r ≤ 1.

Егер r < 0, онда х шамасы артқан сайын оларға сәйкес келетін у екінші вариациялық қатардың мәндері кемиді. Егер r> 0, онда бір шаманың мәні артқан сайын екіншісі де артады. Егер r =0, онда х және у шамалары абсолютті тәуелсіз. r = 1 болғанда шамалар арасында тура пропорционал функционалдық тәуелділік бар ( медициналық-биологиялық зерттеулерді өте сирек жағдай). 7 суретте тәуелділіктің бірнеше типтік варианттары және оларға сәйкес келетін корреляция коэффициенттерінің мәндері көрсетілген.



7 Сурет – X және Y айнымалылары арасындағы тәуелділік варианттарының және олардың сәйкес Пирсон корреляция коэффициенттерінің схемалық сызбасы

Медициналық-биологиялық зерттеулерде кейбір жағдайларда параметрлік емес әдістер қолданылады: егер таңдама кіші болса, таңдама қалыпсыз тарамдалса, сапалық мәліметтермен жұмыс істесек, онда К. Спирмен рангтар корреляциясының коэффициенті қолданылады

мұнда di — қатарлас белгілердің рангілері арасындағы айырма, n — қатардың жұп мүшелерінің саны.

Толық байланыс кезінде белгілердің рангілері дәл келеді және олардың айыр-масы 0-ге тең болады, сәйкесінше корреляция коэффициенті 1-ге тең болады. Егер белгілер тәуелсіз вариацияланса, корреяция коэффициенті 0-ге тең болады.

Әдетте «корреляция коэффициенті» дегенде Пирсон корреляция коэффициентін айтатын. Бұл жағдайда мынаны түсінген дұрыс, бұндай корреляция коэффициенті түзусызықтыдан (сызықтық тәуелділік) қатты ауытқымайтын байланыстарды ғана қанағаттанарлық түрде сипаттайтынын түсіну керек. Яғни егер корреляция коэффициенті нольден өзгешелігі үлкен болмаса, бұл байланыстың мүлдем болмайтынын білдірмейді, бұл тек қана зерттелетін айнымалылар арасындағы сызықтық байланыстың жоқтығын білдіреді. Алдымен бұл байланыс қандай типке жататынын анықтау керек — түзусызықты ма, әлде қисықсызықты ма, оны анықтау үшін регрессияның эмпирикалық сызығын салу керек. Байланыстың түзусызықтыдан ауытқуының мүмкін дәрежесі нақтырақ қисықсызықтылық критерийлерінің көмегімен анықталады. Егер оқытылатын байланыс қисықсызықты болса, бұндай байланыстың күшін анықтама құралдарда не кітаптарда көрсетілген әдістердің көмегімен бағалауға болады.

Оқырмандарды корреляциялық талдау жүргізгенде жиі кездесетін принципиалды қателермен таныстырғымыз келеді. Ең таралған қателердің бірі — есептелген корреляция коэффициентінің статистикалық мәнділігін тексерудің жоқтығы. Әдеттегі практикада корреляцияның таңдама коэффициенттерін есептеу жүргізіледі (әдетте кіші көлемдегі таңдамалар бойынша) және мәнділікті бағалау ретінде есептелген мәнді 0,3-пен салыстыру алынады. Бұл әдіс қате, себебі корреляция таңдама коэффициентінің статистикалық мәнділігі өзі есептелетін таңдамалардың көлеміне тәуелді. Жиі бар таңдамалардың көлемі статистикалық мәнді корреляция таңдама коэффициентін алу үшін жеткіліксіз. Мынаны есте сақтау керек, мысалы, п = 15 болғанда таңдама корреляция коэффициентінің r= 0,5 мәні а = 5% деңгейде мәнсіз болып қалады, ал п = 50 кезінде таңдама корреляция коэффициентінің одан кіші мәні r= 0,3 бірдей деңгейде а стастикалық мәнді болып шығады.

Бірақ статистикалық сенімді корреляцияны тапқан кезде, құбылыстар арасында жиі басқа қате шығады — оларды себепті байланыспен тікелей байланыстырып тастау. Осы жағдайда тұжырымдардың қате логикалық тізбегі қате қорытындыға әкеледі. А және В құбылыстары тығыз корреляциялық байланыста болғандықтан, В құбылысы уақыт бойыншаА құбылысынан кейін пайда болады, яғни А құбылысы В құбылысының себебі болады. Бірақ А және В құбылыстары бір-бірімен тек себепті-салдарлы байланыспен ғана байланыспай қалмай, сонымен қатар бірыңғай басқы себебі де болмауы мүмкін.



9 мысал. Талшықта В затының құрамы мен А дәрмегін қабылдаған пациенттердің қанында D затының концентрациясының өсуі арасындағы тәуелділік зерттеледі (5 кесте).

5 кесте


B және D заттарының қандағы мөлшері, ммоль/л

В затының құрамы

8

8

9

10

7

7

9

9

11

6

D затының концентрациясы

4

5

4

3,5

5

5

3,5

4

2

5

Алдымен зерттелетін параметрлердің регрессия сызығын салып аламыз, сонда бұл тәуелділік түзу сызықен жақсы аппроксимирленетінін көреміз, яғни байланыс сызықтық болып табылады (8 сурет).

8 сурет – 9 мысал үшін зерттелетін параметрлердің арасындағы регрессиялық тәуелділіктің графикалық көрінісі. Абсциссалар осімен – В затының құрамы, ммоль/г; ордината осімен - D затының концентрациясының өсуі, ммоль/л.


Бұндай сызықтық байланыстың тарлығын бағалау үшін корреляция коэффициентін есептейміз (мысал үшін, параметрлік, таңдама көлемінің аздығына қарамастан, n = 10). Пирсон корреляция коэффициенті, (56) бойынша бағаланған, r = -0,91 ге тең. «Минус» таңбасы бір белгінің үлкен мәндеріне екінші белгінің кіші мәндері сәйкес келеді. Есептелген корреляция коэффициентінің мәнділігін бағалайық, статистика мәні tr=-6,17. Бұл статистиканы f= 10-2 = 8 бостандық дәрежелері саны және 5% мәнділік деңгейі үшін Стьюдент тарамдалу кестелері бойынша тексереміз. Есептелген статистика мәні (tr=- 6,17) модулі бойынша сәйкес кестелік мәннен асады (2,31). Осылайша, нольдік болжамды р < 0,05 мәнділік деңгейінде қабылдамайды да, есептелген корреляция коэффициенті статистикалық мәнді болып есептеледі. Бұл жағдайда есептелген корреляция коэффициенті статистикалық жоғары мәнді болып табылады (р<0,001).

Біздің мысал үшін рагілердің корреляция коэффициентін бағалаймыз (6 кесте). Егер қатардың жеке варианттары қайталанбаған болса, олардың рангілері 1-ден бастап өсу ретімен натурал сандар болар еді. Бірақ варианттардың бірдей мәндеріне олардың рангілерінің орташа арифметикалықтарына тең рангілер теңестіріледі. di шамасы зерттелетін таңдамалардың рангілерінің айырма жұптары болып табылады. Ранжирлеу дұрыстығын тексеру ережесі ретінде di суммасының 0 теңдігі алынады.



6 кесте

Спирмен корреляция коэффициенттерін есептеу кестесі



x1

x2

РангRx1

Ранг Rx2

di = Rx1-Rx2

di2

8

4

4,5

5

-0,5

0,25

8

5

4,5

8,5

-4,0

16,0

9

4

7

5

2,0

4,0

10

3,5

9

2,5

6,5

42,25

7

5

2,5

8,5

-6,0

36,0

7

5

2,5

8,5

-6,0

36,0

9

3,5

7'

2,5

4,5

20,25

9

4

7

5

2,0

4,0

11

2

10

1

9

81,0

6

5

1

8,5

-7,5

56,25

di2 суммасы 296-ға тең, n = 10 үшін рангілі корреляция коэффициентін rs = -0,82 аламыз. 5% мәнділік деңгейі (za= 1,96; т = 0,16) үшін критикалық нүкте 0,64-ке тең.

Рангілі корреляция коэффициенттің мәні модулі бойынша сәйкес критикалық мәннен үлкен болғандықтан, 95%-тен көп ықтималдықпен салыстырылатын параметрлер арасында мәнді теріс корреляциялық байланыс бар деп тұжырымдауға болады.




Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   10




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет