Мәліметтерді статистикалық өңдеу әдістері
Мәліметтерді статистикалық өңдеу психологиялық феномендерді себептік түсіндірудің қажетті кезеңі болып табылады. Маңызды ақпарат алу үшін белгілі бір әрекеттер тізбегі бар: іріктеу, алдын-ала өңдеу, түрлендіру, білім алу үшін әдісті қолдану, түсіндіру [245].
Мәліметтерді сандық өңдеу үшін келесі әдістер алынды: сипаттамалық статистика (кестелік көрсету, графикалық көрсету, орташа мән, жиілікті талдау), параметрлік емес тесттер: Манн-Уитни U-тесті, Крускал-Уоллистің Н-критерийі, корреляциялық талдау (r-Spearman's), дендрограмманы құрастыру арқылы иерархиялық кластерлік талдау (сурет 7).
Сурет 7 - Статистикалық мәліметтерді өңдеу кезеңдері
Манн-Уитни U тесті екі тәуелсіз үлгіні параметрлік емес салыстырудың ең танымал және кең таралған сынағы. Ол екі үлгінің мәндерінің бір жалпы тізбегін қолдануға негізделген. Манн-Уитни U-критерийі (Mann-Whitney U test) – сандық немесе реттік шкала бойынша өлшенген екі үлгінің арасындағы айырмашылықты бағалау үшін қолданылатын параметрлік емес статистикалық критерий. U-критерий дәреже болып табылады, сондықтан ол өлшеу шкаласының кез-келген монотонды түрлендірілуіне қатысты инвариантты болады.
Критерийлерді есептеу нәтижелеріне жеке топтардағы орташа дәрежелер, критерийдің мөлшері және p қатесінің ықтималдығы кіреді. p 0,05 қатесінің ықтималдығы бар мәлімдемелер маңызды деп аталады, p 0,01 қатесінің ықтималдығы бар мәлімдемелер өте маңызды, ал p 0,001 қатесінің ықтималдығы бар мәлімдемелер максималды маңызды [246].
Крускал-Уоллистің H-критерийі бірнеше үлгілердің медианаларының теңдігін тексеруге арналған параметрлік емес әдіс болып табылады Крускал-Уоллистің H-критерийі K байланыссыз үлгілер (k>2) жағдайында Манн-Уитнидің U-критерийін жалпылау болып табылады және қандай да бір белгі деңгейі бойынша үш, төрт және т.б. үлгілер арасындағы айырмашылықтарды бір мезгілде бағалауға арналған. Бұл үлгілердегі белгінің өзгеру дәрежесін анықтауға мүмкіндік береді, алайда бұл өзгерістердің бағытын көрсетпейді. Үлгілердің көлемі әртүрлі немесе бірдей болуы мүмкін. Х белгісі ерікті бөлуге ие. Н-критерий параметрлік емес болғандықтан, ол дәрежелерді қолданады. Критерий келесі идеяға негізделген - егер үлгілер арасындағы айырмашылықтар шамалы болса, онда дәрежелер сомасы бір-бірінен айтарлықтай ерекшеленбейді және керісінше [247].
Корреляциялық талдау. Корреляциялық талдаудың негізгі мақсаты екі немесе одан да көп зерттелген айнымалылар арасындағы корреляциялық байланысты анықтау болып табылады.
Корреляциялық байланыс–бұл зерттелген екі сипаттаманың бірлескен, келісілген өзгерісі. Бұл өзгергіштік үш негізгі сипаттамаға ие: пішіні, бағыты және күші. Байланыс күші зерттелетін айнымалылардың бірлескен өзгергіштігінің қаншалықты айқын көрінетінін тікелей көрсетеді.
Корреляция коэффициенті («r» деп белгіленеді) арнайы формула бойынша есептеледі және -1-ден +1-ге дейін өзгереді. +1-ге жақын көрсеткіштер («тікелей байланыс») бір айнымалының мәні жоғарылаған сайын басқа айнымалының мәні артады деп болжайды. -1-ге жақын көрсеткіштер («кері байланыс») кері байланысты көрсетеді, яғни бір айнымалының мәні жоғарылаған кезде екіншісінің мәні азаяды.
Спирмен коэффициенті (r-Spearman's) классикалық Пирсон корреляция коэффициентінің параметрлік емес аналогы болып табылады, бірақ оны есептеу кезінде салыстырмалы айнымалылардың (орта арифметикалық және дисперсия) таралуына қатысы жоқ көрсеткіштері есепке алынады, бірақ қатарлар.
Спирмен коэффициенті психологиялық зерттеулерде кеңінен қолданылады. Компьютерлік бағдарламаларда (SPSS, Statistica) бірдей r-Пирсон және r-Спирмен коэффициенттері үшін маңыздылық деңгейлері әрқашан сәйкес келеді.
r-Пирсон коэффициентімен салыстырғанда r-Спирмен коэффициентінің артықшылығы байланысқа үлкен сезімталдық болып табылады. Біз оны келесі жағдайларда қолданамыз:
қалыпты формадан кем дегенде бір айнымалының үлестірімінің елеулі ауытқуының болуы (ассимметрия, шектен шығу);
қисық сызықты (монотонды) байланыстың пайда болуы.
R-Спирмен коэффицентін қолдану үшін шектеулер болып мыналар табылады:
әр айнымалы бойынша кемінде 5 бақылау;
бір немесе екі айнымалы үшін бірдей дәрежелердің көп саны бар коэффициент қатаң мән береді [248].
Дендрограмманы құрумен иерархиялық кластерлік талдау – процедура алгоритм көмегімен берілген сипаттамалар бойынша салыстырмалы түрде біртекті бақылау топтарын (немесе айнымалыларды) анықтауға арналған, ол алдымен әрбір бақылауды (айнымалыны) жеке кластер ретінде қарастырады, содан кейін кластерлерді тек біреуі қалғанша дәйекті түрде біріктіреді. Сіз бастапқы айнымалыларды талдай аласыз немесе стандартталған түрлендірулер жиынтығын қолдана аласыз. Бастапқы айнымалыларды талдауға немесе стандарттау түрлендірулер жинағын пайдалануға болады.
Иерархиялық кластерлеудің мәні кішігірім кластерлердің үлкен кластерге бірігуі немесе үлкен кластерлердің кішіректерге бөлінуі болып табылады.
Кластерлеудің иерархиялық әдістері кластерлерді құру ережелерімен ерекшеленеді.
Ереже ретінде объектілерді топқа біріктіру (агломерациялық әдістер) не топтарға бөлу (дивизимді әдістер) кезінде олардың «ұқсастығы» туралы мәселені шешу кезінде пайдаланылатын өлшемшарттар қолданылады. Зерттеуде «алыс көрші» дивизимді бөлу әдісі қолданылды.
Толық байланыс (ең алыс көршілердің қашықтығы, алыс көрші әдісі).
Бұл әдіспен кластерлер арасындағы қашықтық әртүрлі кластерлердегі кез-келген екі объект арасындағы ең үлкен қашықтықпен анықталады (яғни, ең алыс көршілер).
Бұл әдіс әдетте объектілер жеке топтардан шыққан кезде өте жақсы жұмыс істейді. Егер кластерлер ұзартылған болса немесе олардың табиғи түрі «тізбекті» болса, онда бұл әдіс жарамсыз.
Кластерлеудің иерархиялық әдістерінің артықшылығы – олардың көрінуі.
Иерархиялық алгоритмдер иерархиялық кластерлік талдаудың нәтижесі болып табылатын дендрограммаларды (грекше dendron – «ағаш») құрумен байланысты. Дендрограмма жеке нүктелер мен кластерлердің бір-біріне жақындығын сипаттайды, кластерлерді біріктіру (бөлу) тізбегін графикалық түрде ұсынады.
Дендрограмма (dendrogram) – әрқайсысы кластерлерді дәйекті ірілендіру процесінің қадамдарының біріне сәйкес келетін n деңгейден тұратын ағаш тәрізді диаграмма. Дендрограмма ағаш схемасы, кластерлерді біріктіру ағашы, иерархиялық құрылым ағашы деп те аталады.
Дендрограмма – иерархияның әртүрлі деңгейлерінде өзгеретін кірістірілген нысандар тобы. Дендрограммаларды құрудың көптеген жолдары бар. Дендрограммада нысандар тік немесе көлденең орналасуы мүмкін[249].
Достарыңызбен бөлісу: |