7
Кітап:
Дәріс:
Статистика
негіздері
Ықтимал іріктеменің негізгі әдістері мен басты ұғымдары: бас жиынтық, іріктеме, параметрлер,
статистика, репрезентативтілік, EPSEM
өлшемдері туралы маңызды ақпарат екі теоремада берілген. Теореманы қарастырмас бұрын, пайдаланатын
символдарды шолып шығайық. Еске түсірейік, іріктемелік арифметикалық орта – X, ал бас арифметикалық
орта – арқылы белгіленеді. Дисперсияны өлшеу үшін іріктеменің стандартты девиациясы – s символын
пайдаланамыз, ал бас жиынтықтың стандартты девиациясын σ (Грек әрпі кіші сигма) символымен
белгілейміз.
Бұл теоремалардың бірі былай тұжырымдалады:
N көлемді қайталанған кездейсоқ іріктеменің арифметикалық ортасы – µ (мю), ал стандартты девиациясы
– σ(сигма) қалыпты популяциядан алынса, іріктемелік арфиметикалық ортаның іріктеу үлестірімі қалыпты
болады, яғни мұндағы арифметикалық орта – µ және стандартты девиация – σ / тең.
Түсіндірмесі: Егер бас жиынтыққа қалыпты үлестірілген белгімен бастап, (мысалы, IQ көрсеткіштерін
алуға болады), әрі қарай сол бас жиынтықтан тең көлемді кездейсоқ іріктемелердің шексіз санын алсақ,
іріктемелік арифметикалық ортаның іріктеу үлестірімі қалыпты болады. Егер біз айнымалы бас жиынтыққа
қалыпты үлестірілгенін білсек, іріктеу үлестірімі қалыпты болады дей аламыз.
Дегенмен іріктеу үлестірімінің формасына қарағанда теорема көп нәрседен хабардар етеді. Сонымен
қатар, ол арифметикалық орта мен стандартты девиацияны анықтайды. Шындығында, іріктеу үлестірімінің
арифметикалық ортасы бас жиынтықтың арифметикалық ортасының мәнімен бірдей. Яғни егер тұтас бас
жиынтықтың орташа IQ-і – 100 болса, іріктеу үлестіріміндегі іріктелген кез-келген IQ-дың арифметикалық
ортасы да 100-ге тең болады.
Неліктен бұл екі арифметикалық орта бірдей мәнге ие екені дәл осы деңгейде толық түсіндірілмейді.
Алайда, іріктемелік арифметикалық ортаның көбі ұзақмерзімді уақытқа бас жиынтықтың мәні
айналасында топтасады. Олай болса, осы екі мәннің тең болғаны туралы факттің өзі интуициялық
болады. Ал
дисперсияға келер болсақ, теорема бойынша іріктеу үлестіріміндегі стандартты девиация,
яғни арифметикалық ортаның стандартты қателігі N-нің квадрат түбіріне бөлінген бас жиынтықтың
стандартты девиациясына тең (символдық түрде ол былай беріледі: σ /).
Егер бас жиынтықтағы қалыпты таралған айнымалының арифметикалық ортасы мен стандартты
девиациясы белгілі болса, теорема арқылы іріктеу үлестірімінің арифметикалық ортасы және стандартты
девиациясын есептеуге жол ашылады. Осылайша, кез-келген эмпирикалық үлестірім туралы білетініміздей,
енді іріктеу үлестіріміне де қатысты соншалықты нақты білетін боламыз (мысалы, формасы, орталық
тенденциясы және дисперсиясы болуы мүмкін).
Бірінші теоремаға сәйкес, айнымалы бас жиынтыққа қалыпты үлестірілуі тиіс. Қарастырып отырған
айнымалы белгісіз немесе формасы жағынан қалыпты емес болса ше (мысалы, әрдайым оң ассиметриялы
кіріс)? Мұндай (шын мәнінде, өте кең тараған) ықтималдықтар орталық шектік теорема деп аталатын
екінші теорема аясында қарастырылады:
Егер N көлемді қайталанатын, бір-біріне ұқсас кездейсоқ іріктемелердің арифметикалық ортасы – µ,
стандартты девиациясы – σ қалыпты бас жиынтықтан алынса, онда N үлкен болған сайын, іріктемелік
арифметикалық ортаның іріктеу үлестірімі қалыптыға жақын болады, мұндағы арифметикалық орта – µ
және стандартты девиация – σ / тең.
Түсіндірмесі: Тіпті айнымалы бас жиынтық бойынша қалыпты үлестірілмесе де, кез-келген айнымалы
үшін іріктеме көлемі артқан сайын, іріктемелік арифметикалық ортаның іріктеу үлестірімі қалыптыға жақын
бола бастайды. Егер N үлкен болса, онда іріктеу үлестірімінің арифметикалық ортасы бас жиынтықтың
арифметикалық ортасына тең болады, ал оның стандартты девиациясы (немесе арифметикалық ортаның
қалыпты қателігі) σ / өрнегіне тең болады.
Орталық шектік теорема – маңызды, себебі мұнда айнымалы бас жиынтықта қалыпты үлестірілуі
керек деген шарт жоқ. Іріктеме көлемі үлкен
болған сайын, үлестірімнің арифметикалық ортасы бас
жиынтықтың арифметикалық ортасына тең болады, стандартты девиациясы σ / өрнегіне тең болады.
Ендеше іріктеу үлестірімі формасы жағынан қалыпты деп ұйғара аламыз. Олай болса тіпті егер (кіріс
сияқты) симметриялы емес үлестірімді айнымалымен жұмыс жасасақта, біз әлі де қалыпты іріктеу
үлестірімі деп болжауымызға болады.
Ең соңғысы, үлкен іріктеме нені білдіретінін анықтап алайық.
Басты ереже – іріктеме көлемі (N) 100-ге тең немесе одан артық болса,
Орталық шектік теорема
қолданылады. Яғни, іріктемелік статистиканың іріктеу үлестірімінің формасы қалыпты деп болжауға
болады. Егер N 100-ден кем болса, іріктеу үлестірімін қалыпты деп қабылдамас бұрын, бас жиынтықтың
қалыпты үлестірімінің жақсы дәлелі болуы керек. Ендеше, іріктемелер 100-ден артық болған сайын іріктеу
үлестірімі қалыпты болады деп ұйғаруымызға болады.
Кітап:
Дәріс:
Статистика негіздері
Ықтимал іріктеменің негізгі әдістері мен басты ұғымдары: бас жиынтық, іріктеме, параметрлер,
статистика, репрезентативтілік, EPSEM
8
Іріктеу үлестірімі ұғымын (яғни, ол не, неге маңызды екенін) жеткізу – оңай шаруа емес. Осы орайда
іріктеу үлестіріміне қатысты бірқатар маңызды нүктелерін қойып шығайық:
1. Анықтамасы: Іріктеу үлестірімі дегеніміз белгілі бір көлемдегі ықтимал іріктеме нәтижесіне
арналған статистиканың үлестірімі (мысалы, арифметикалық орта немесе пропорция). Іріктеме
мен
бас жиынтыққа қарағанда, іріктеу үлестірімі теориялық болады, осы лекцияда ұсынылған
теориялардың арқасында оның формасы, орталық тенденция өлшемін және дисперсиясы белгілі.
2. Формасы: қалыпты (5-тарау мен А аппендиксін қараңыз). · Іріктеме «үлкен» (N 100-ден әлдеқайда
артық), сондықтан іріктеу үлестірімінің формасы қалыпты болады. Бұл бас жиынтықтағы
айнымалының формасына қарамастан шын/әділетті болады.
3. Орталық тенденция және дисперсия өлшемі: Іріктеу үлестірімінің арифметикалық ортасымен бас
жиынтықтың арифметикалық ортасының мәні бірдей болады. Егер барлық ересек қазақстандықтар
орта есеппен 11 жылда (=11) мектеп бітірсе, іріктеудің де арифметикалық ортасы 11 болады.
4. Іріктеу үлестірімінің стандартты девиациясы (немесе орташа мәнінің қалыпты қателігі) бас
жиынтықтың стандартты девиациясын (кіші сигма) квадрат түбір астындағы N-ге бөлгенге тең.
5. Инференциалды статистикадағы іріктеу үлестірімінің рөлі:
Іріктемені бас жиынтықпен
байланыстырады (6.1-суретті қараңыз).
Осылайша, теоремалар іріктеу үлестірімінің (форма, орталық тенденция өлшемі және дисперсия)
статистикалық сипаттамалары туралы мәлімет береді, ал бұл ақпарат бас жиынтық пен іріктемені
байланыстыруға мүмкіндік береді.
Қорытындылай келе, мақсат – бас жиынтық туралы ақпарат беру (GSS жағдайында, барлық ересек
америкалық). Бас жиынтық тестілеу үшін тым үлкен болған кезде,
ақпаратты бас жиынтықтың
сипаттамаларын бағалау үшін мұқият жасалған кездейсоқ іріктемеден аламыз.
Осы тұжырымдарды бекіту үшін оқулықтағы SPSS жаттығуларына арналған дерекқорлардың
бірі – Жалпы Әлеуметтік сауалнаманы (General Social Survey) пайдалана отырып, қосымша
мысалды қарастырулыраңызға болады. Жалпы әлеуметтік сауалнама (GSS) 1972 жылдан бері ересек
америкалықтардың кездейсоқ таңдалған іріктемесін қолданады. Ол әртүрлі мәселелердің кең ауқымын
зерттейді. GSS-тің кемшіліктері де бар, дегенмен ол теорияны сынау мен сол қоғамды көбірек білудегі өте
бағалы ресурс.
Бас жиынтықтан немесе зерттеу нысанына алынған топтан бастайық. GSS жағдайында, бас жиынтық
(18 жастан жоғары) 235 миллион америкалықтан тұрады. Әрине, олардың барлығымен сұхбат жүргізіп,
олардың қандай екені немесе аборт жасау, қару-жарақты бақылау, орта мектептердегі жыныстық тәрбие
немесе кез-келген басқа мәселе туралы ойын білу мүмкін емес. Дегенмен, осы ақпараттың маңызы бар
екенін ескеруіміз керек. Бұл қоғамдық талқылауларды ақпараттандыруға көмектесіп,
көптеген даулы
мәселелерді талқылаудың негізі болады (мысалы, сауалнамалар тұрақты түрде америкалықтардың
көпшілігі қаруды бақылаудың кейбір түрлеріне қолдау көрсететінін анықтайды) және адамдарға жеке
сенімдерін түсіндіруге көмектеседі. Егер ақпарат құнды, қажет болса, үлкен бас жиынтық туралы қалайша
көбірек ақпарат алуға болады?
Бұл бас жиынтықтың мұқият таңдалған топтамасына, яғни іріктемеге алып келеді.
GSS бірнеше мың адам үшін ұйымдастырылған, олардың әрқайсысы EPSEM қағидасына негізделген
күрделі технологиямен таңдалады. Белгілі бір бас жиынтықтан таңдалып алынған іріктеме сол жиынтық
үшін репрезентативті болады. Іріктемеге қатыстының барлығы бас жиынтыққа да қатысты болады
(әлбетте, кейбір кемшіліктер және ескертпелер де баршылық).
Респонденттермен сұхбат жүргізіп, олардың шығу-тегі (ұлты, діні, жасы, жынысы, білім алу жылдары
және т.б.) туралы ақпарат, сондай-ақ пікірлері мен көзқарастары сұралады.
Осындай ақпарат толық
жинақталғанда, GSS дерекқоры іріктемедегі адамдарға қатысты жүздеген айнымалы бойынша (жасы,
жаңсақ пікір деңгейі, отбасылық жағдайы) мәліметті (формасы, орталық тенденция өлшемі, дисперсия
өлшемі) қамтиды. Сонымен, іріктеме үшін айнымалылар туралы мол ақпарат қолымызда бар дерлік (олар
шынымен сауалнамаға жауап берген адамдар), бірақ бас жиынтық үшін бұл айнымалылар туралы ешқандай
мәлімет жоқ (яғни бас жиынтық деп отырғанымыз бұл жағдайда 235 миллион ересек америкалықтар).
Белгілі іріктеме арқылы белгісіз бас жиынтық туралы қалай ақпарат ала аламыз? Бұл – инференциалды
статистикадағы басты мәселе; ал оның жауабы – «іріктеу үлестірімін қолдану».