Диплом жүмысы тақырыбы: «Бастауыш сыныпта есім сөздерді оқыту»



бет7/18
Дата15.06.2016
өлшемі1.89 Mb.
#137473
түріДиплом
1   2   3   4   5   6   7   8   9   10   ...   18

N >І N

Мүнда Р, - сөз формасыныц пайда болу ыктималдығы; Ғ, - абсолютті жиілік; N - тавдама (жиын) колсмі;

-— = ./, - қатынасты жишік;

2р - сенімділік коэффициенті. Ксйбір мүмкін болған жағдайларда қатынасты қатслік үшін мына формуланы қолданамыз:

20

л = — < -=4= немссс гУ =



Осыдан жиілік пен таңдаманың және кдтынасты кдтеліктің арасындагы өзара байланыс формуласын аламыз [16,31-33].

М = -ү- мүнда N - сөз қолданыстардың келемі; 5 {

5 - бақылаудың қатынасты қателігі; іх - сөз формаларының қатынасты жиілігі.

Сенімділік деңгейінің мондеріне осы зерттеудс сүйенетін мәнділік деңгейлері сәйкес кследі. Бүл болжамдарды текссру үшін 5% жәні 1% мәнділік деңгейлерін қолданамыз. Мәнділік деңгейі мен сенімділік мына шамалармсн беріледі: 5% немесе 0,05; 95% немесе 0,95. Мәнділік деңгейі алдын-ала белгіленген нәтижелерден кездейсоқ ауытқу ықтималдыгын білдіреді.

Соңғы кездері қолданбалы зерттеулерде сенімділік дсңгсйлсрі /?=0,95 немесе 0,99 шамаларымсн алынуда. Тіл білімінде аса үлксн сенімділік деңгейлсрі қажет болмайтындықтан /»=0,95 шамасын қодданады. Бүдан былайгы эксперименттерімізде осы мөлшерді пайдаланбақпыз. Сенімділік деңгейі (р) сенімділік коэффицентімен (2р) байланысты жәнс оган бслгілі бір дәрежеде тәуелді. Соған байланысты /7=0,95 болса, онда 2Р=1,96 [16,36].

Жоғарыда айтылғандарға сүйене отырып, жиілік создікке берілген белгілі бір жиіліктегі түрлі сөздер қамтылуы үшін минимадды шектегі таңдаманы төмендегідей формуламен алута болады.

Мүндағы Гшек - моні сенімді лексикалық бірліктіц томенп шегінің (Ғшек) монінс сәіікес келетін лексикалық бірліктердің катынасты жиілігі, - сенімділіктің берілген мәнінен алынатын туракты мән, ішек - ықтималдық багасын білдірсе, 8 катынасты катслік. Тәжірибелер көрсеткендей 116.37). 70% қамтылуды сөздіктің 3000-5000 сөз формаларын қамтіггын бастапқы аумақтары берсді

(Гшек=0,00004).

Жеткілікті мөлшердегі таңдама көлемін аныктауда одстге мына талаптар қойылады:



ч Байқаудың жіберілуі мүмкін қатынасты қателігі £=0,33 2) Сенімділік /;=0,95; 2,, =1,96

21

3) Сөзбен қамтылу 70% дсмек,



1.96' (I- 0,0004)


н 90()00

0,332 -0,00004

Әйтсе дс біздің карастырғанымыз таңцамалы колем емсс, мәтіндерді түтастай зерттеу болғандықган, 200 000 сөз қодданыс мөлшері жеткілікті келем болып табылады. Бірақ зерттеу мақсатына сәйкес БСО мәтіндерімен езара салыстырылатын әр түрлі тандамаларды ескере отырып, бүлардың барлығын, яғни, БСО мәтіндерін де шартты түрде "таңдама" дсп атауды үйғардық.

Демек, жеткілікті мөлшсрдсгі мәтін көлсмі бақылаудың жіберілуі ықгимал қатынасты және абсолютті қатсліктері, берілген сснімділік. алдын-ала анықгалған мәтіннің сөзбен қамтылуы және онымен байланысты нақгы жиіліктің томенгі шсгі секілді шамаларга байланысты болады [16,33]. Бүл барлық шамалар бір-бірімен өзара тығыз байланысты жәнс тілдің қүрылысы мсн мәтіннің лингвистикалық қүрылымына тоуслді. Анықталған тандама негізіндс 50 жылдардағы БСО мәтіндеріндегі сөздер мсн сөз формаларыныц жиілік сөздігі (ЖС), алфавитті-жиілік создігі (АЖС) жоне ксрі алфавитті-жиілік создіктері (КАЖС) алынды (1,2-кестелер).

Қазақ мәтіндеріне статистикалық талдау жасау кезінде

қиындықтар кездесті. Атап айтқанда, түрақты тіркестерді ажырату.

күрделі сөздер мен терминдерді жскс қарастыру т.б. Сондықтан да

шартты түрдегі критерийлер белгілеу жолымсн бүл қпындықтарды

жеңіддетуге тырыстық. Мәтін бірлігі ретіндс "сөз қолданыс" деген

атауды қолдандық. Мәтінге статистикалық зерттеу жүргізу кезіндс

сыртқы формалары бір-біріне сойксс келетін сөз қолданыстары

көптеп кездеседі, бүларды "со:з формасы" деп алдық. Бүл сөз

формалары алфавитті-жиілік сөздіктің бірлігі рстінде де қолданылады.

Негізгі лексикалық мағыналары өзара жақын сөз формаларыныц

жиыны "сөз" деп аталатын лексикалық бірліктсрді қүрайды. Жиілік

сездіктегі әрбір сөз бастапқы негізге немесе түбірге кслтірілді,

Мысалы, барды, барып, барган, барма, барамын т.б. сөз

формаларының негізі ретіндс бар сөзі алынды. Зерттеу жүргізілген

мәтііідерімізде бастапқы негіз немесе түбір ретінде есім сөздер үшін

жекеше түрдсгі атау септігі формасы, ал етістіктер үшін П-жак

"Үйрық рай формасы алынды. Себебі, кейбір сөздіктерде алынып

келген түйық рай формасы сөз топтарын ажыратуда, яғни сөздерді

белгілі бір топқа жатқызуда қиындық келтіретін болды. Үстеу, одағай,

еліктеу сөздер мен көмекші сездер негізінен түбір формада кездесіп

Отьірғандықтан көбіне сол күйіндс қалдырылды.

Зерттсу барысында сөздср мен сөз формаларына арнайы *ндекстеу жүргіздік немесс орбір созді шартты түрдс алынған бір



22

таңбамен бслгілсп отырдық. Бүл сөз таптарының классификациясына негізделді. Қазіргі тіл біліміндс создер негізгі үш белгісінс қарай таптастырылуда: лсксикалық магынасы, морфологиялық қүрылымы және синтаксистік қызмсті [41,182]. Осы үш белгілсрін салыстыра отырып, әрбір сөзді белгілі топқа қатысты белгілермсн таңбаладық. Бүл жерде сөздерді индекстсу мен оларға морфологиялық талдау жасауда кері алфавитті-жиілік создіктерді де пайдаландық [42,17]. Сөздерді бүлайша лексика-грамматикалық топтарға бөлу кезіндс кейбір қиындықгар байқалды. Атап айтканда, омонимдерді ажырату кезінде әрбір сездің мағынасы тек контекстс қарастырганда ғана анықгалды. Бүл омонимдерді ажыратуға септігі тигенімен, бір соз табынан ішіндегі омонимдерді ажыратуда сөз топтарына қарасты таңбаларға қосымша цифрлар белгілеуге мәжбүр болдық (8,10-кестелер). Сонымен, сөздердің белгілі бір лексика-грамматикалық топқа қатыстылығы мына төмендегіше белгіленді: з - зат есім, с сын есім, а - сан есім, е - етістік, ү - үстеу, л - еліктеу сөздер, м -есімдік, ш - шылау, о - одағай, д - модаль сөздер (әртарап, бейтарап сөздер), к - көмскші есімдер. Ал снді лексикалық омонимдерді ажыратуда 2- кісі аттары, 4- қысқарған сөздер, 5 - ойын аттары, 6 -газет-журналдар, оқулықтар, коркем шығармалар мсн ғылыми еңбектердің аттары, 7 - географиялық атаулар, 8 - ру, тайпа, үлт аттары, 9 - жануарлардың аттары деп алынды (3-6-кестелер).

Әдсгте жиілік сөздіктері алынатын мәтіндерді зерттеудің екі түрі белгілі: мәтіндердің барлығын түтас қарастыру жәнс тандамалы зерттеу. Мәтіндерді түтасымен зерттеу кезіндс бізді қызықтырған нысанадаҮы лексикалық бірліктің барлық қолданыстары түгел қамтылуы тиіс. Ал таңдама (выборка) арқылы зерттеуде белгілі бір мақсатқа сәйкес әр түрлі көлемдегі тандамалы мәтіндер сараланып. таңдалып шіынады. Мүнда сң аз мөлшердегі минималды таңдама мәтін көлемі шамамен алғанда 1000 сөз қолданыстағы мелшер болып табылады. Зерттеу барысында бүл ею әдістің ішінде мәтівді түтасымен қарастыру түрін қолданғанымызбен, кеіібір эксперименттсрде тандама мәтін арқылы зерттеу одісін де пайдаланып отырдық. Егер жиілік сөздік таңдама одісі арқылы алынатың болса, онда алынған статистикалық модсль түпнүсқасының ерекшеліктсрін қаншалықты қамти алатындығы жайлы сүрақ туындайды. Мүндай жағдайда алынған мотіншн (таңдаманың) өз түпнүсқасына сәйкестілігі болса, онда бүл таңдаманың дүрыс алынгандығын көрсетеді. Алынған жиілік сөздіктің сапасын көрсететін екінші бір жағдай - тізімге (рссстргс) алыиған -өздердің әлі зерттелмеген, жаңа мәтіндерде қаншалықты кездссіп отыратындығы.

^ерттеуімізге негіз етіп алынган 50 жылдардағы БСО мөтіндерін У/0-2000 жылдардағы БСО жонс БӘ мотіндсрімен салыстыруда осы

23
жағын да ескердік. Алфавитті-жиілік сөздікте белгілі бір зерттеугс алынған мәтін көлеміндсгі сөздердің не олардың түлгаларының қодданылу жиілігі көрсетілс отырып, алдыңғы әріптсрі бойынша кдтаң әліпби тәртібімен берілсді. Жиілік сөздіктің бул түрі зерттеугс кджет болған лексикалық топтарды оңай ажыратуға, ондагы ксрек сөздерді тез тауып алуға, қаралып отырған мәтіннің стильдік сапасын тандауға, зерттеугс алынған шығарма тілінің лексикалық байлығы мен оны жазған автордыд соз қолданысындағы тілдік срскшсліктерді сонымен бірге шеберлігн білуғс, дублст сәздердің кай нүсқаларының жиі, ал қай нүскдларының сирек қолданылатындығын білу арқылы олардың орныкдылығын аныктауға, жарыса қолданылатын сездердің кдй нүсқаларының әдеби нормадан шығатындығын аныктауға жәрдемдеседі [16; 17; 76,143]. Жиілік сөздік белгілі бір зерттеугс алынған мәтіндегі сөздердің, не" оның түлғаларының қолданылу жиілік санына қарай қатаң кемімелі тәртіппен орналасқан тізбесі болып саналады. Егер мунда сөздер мен оның түлғаларының қолданылу жиілік саны бірдей болып келсе, онда олар алфавитті-жиілік сөздіктегідей алдыңғы оріптері бойынша қатаң оліпби тәртібімен беріледі. Ал снді ксрі алфавитті-жиілік сөздіктер бслгілі бір зерттеу ыысанасындагы мәтін қүрамындағы сөздердің, оның түлғаларының соңғы оріптері бойынша қатаң әліпби тортібімен берілетін, мәтіндегі жиілігі қоса көрсетілетін түрі екені белгілі [16; 17; 76,144]. Жиілік сөздіктің бул түрі зерттеушіге сәздің негізғі бөлшектерін ажыратып тануға және ол бөлшектердің қолданылуына талдамалар жасауға мүмкіндік береді.

1-кесте - 1950-2000 ж.ж. БСО мен БӘ мәтіндері бойынша пайдаланылған материалдар



Сөздік аттары

Соз қолда ныс

Абсолютті жиілік

Создік авторы

N

Ғ с/ф

Ғ сөз

1. Балалар әдебисті (60-70

97260

25365

10077

Молдабск

2. 50 ж. БСО мотіндсрі

_1_£ЬШЫП


24385

8374

3126

Қалыбсков

2 сынып

44125

12885

6513




3 сынып

117451

25716

9344




Жалпы келемі

185961

34522

10298




•*• 70 ж. БСО мәтіндері:

40710

9792

3624

Молдабск

2 сынып

93474

13869

7409




3 сынып

112976

27325

10397

Жалпы көлемі

241984

38445

12281

~Х~90~ж. (1-4 сынып)

226374

39950

12813

Мамаев

5. Өзбек газет мәтіндері

209485

35908

-

Мухамедов

6. Өзбек балалар әдебиеті

100000

26752

-

Ризаев

7. Түрік газеттері

100000

23273

-

Бабанаров

'~8ГҚаракдлпақстан газеті

100000

-

-

Айымбетов

9. 2000 ж. БСО мәтіндері

368965

40142

13869

Ермекбаев

Сонымен бірге ол мәтіндердегі сөз тудырушы және сез түрлендіруші қосымшаларды қиындықсыз тез тауып алуға көмектеседі. Бүларға қоса, кері алфавитті-жиілік сөздіктегі сөз тұлғаларының соңғы әріптеріне қарай бірыңғайласып тәртіппен орналасуы зерітеушіге омонимдес қосымшалардың сыңарларын бір-бірінен ажырата білугс де септігін тигізеді. Ал, олардың мәтіндегі қолданысын керсстетін жиілік көрсеткіштері ол қосымшалардың тұрақгы-тұрақсыздығы, өнімді-өнімсіздігін, нормалану жағдайындағы ерекшелік сипатын анықтауға жәрдсмі тиеді.

2-кестс — 50-70 ж.ж. БСО мәтіндерінің орбір пән бойынша сөзбен қамтылу статистикасы







к/с

Окулықгардың аты

Абсолютті жиілік




70 жылдардағы оқулықтар

Ғс/қ

Ғс/ф

Ғсоі

1

Балалар әдебиеті

100000

25365

10077

2

Әліппе, 1975.

2536

1588

992

3

Қазақ тілі (1 сынып, 1972)

8910

2867

1454

4

Ана тілі (1 сынып, 1972)

11865

5081

2236

5

6



_Математика (1 сынып, 1972)

17399

2443

1044

Қазақтілі (2 сынып, 1973)

13993

4649

1926

7

Ана тілі (2 сынып, 1973)

4?777

13561

5632

8

Математика (9 сынып, 1979)

99495

3394

1221

! 9 10 11

- —


12 13

—■


_Табиғат тану (2 сынып, 1972)

14289

5265

2332

^Сдзақтілі (3 сынып, 1975)

20857

6076

2730

_Ата_тілі (3 сынып, 1975)

51462

15360

7495

і^атематика (3 сынып, 1972)

22899

3668

1297

_іабиғат тану (3 сынып, 1974)

17758

6221

2775

^У_жылдардағы оқулықтар










-&за]ітш_(1 сынып, 1953)

6314

2480

1024

^Шіфметика (1 сынып, 1959)

7391

2080

721


Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   10   ...   18




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет