22
таңбамен бслгілсп отырдық. Бүл сөз таптарының классификациясына негізделді. Қазіргі тіл біліміндс создер негізгі үш белгісінс қарай таптастырылуда: лсксикалық магынасы, морфологиялық қүрылымы және синтаксистік қызмсті [41,182]. Осы үш белгілсрін салыстыра отырып, әрбір сөзді белгілі топқа қатысты белгілермсн таңбаладық. Бүл жерде сөздерді индекстсу мен оларға морфологиялық талдау жасауда кері алфавитті-жиілік создіктерді де пайдаландық [42,17]. Сөздерді бүлайша лексика-грамматикалық топтарға бөлу кезіндс кейбір қиындықгар байқалды. Атап айтканда, омонимдерді ажырату кезінде әрбір сездің мағынасы тек контекстс қарастырганда ғана анықгалды. Бүл омонимдерді ажыратуға септігі тигенімен, бір соз табынан ішіндегі омонимдерді ажыратуда сөз топтарына қарасты таңбаларға қосымша цифрлар белгілеуге мәжбүр болдық (8,10-кестелер). Сонымен, сөздердің белгілі бір лексика-грамматикалық топқа қатыстылығы мына төмендегіше белгіленді: з - зат есім, с сын есім, а - сан есім, е - етістік, ү - үстеу, л - еліктеу сөздер, м -есімдік, ш - шылау, о - одағай, д - модаль сөздер (әртарап, бейтарап сөздер), к - көмскші есімдер. Ал снді лексикалық омонимдерді ажыратуда 2- кісі аттары, 4- қысқарған сөздер, 5 - ойын аттары, 6 -газет-журналдар, оқулықтар, коркем шығармалар мсн ғылыми еңбектердің аттары, 7 - географиялық атаулар, 8 - ру, тайпа, үлт аттары, 9 - жануарлардың аттары деп алынды (3-6-кестелер).
Әдсгте жиілік сөздіктері алынатын мәтіндерді зерттеудің екі түрі белгілі: мәтіндердің барлығын түтас қарастыру жәнс тандамалы зерттеу. Мәтіндерді түтасымен зерттеу кезіндс бізді қызықтырған нысанадаҮы лексикалық бірліктің барлық қолданыстары түгел қамтылуы тиіс. Ал таңдама (выборка) арқылы зерттеуде белгілі бір мақсатқа сәйкес әр түрлі көлемдегі тандамалы мәтіндер сараланып. таңдалып шіынады. Мүнда сң аз мөлшердегі минималды таңдама мәтін көлемі шамамен алғанда 1000 сөз қолданыстағы мелшер болып табылады. Зерттеу барысында бүл ею әдістің ішінде мәтівді түтасымен қарастыру түрін қолданғанымызбен, кеіібір эксперименттсрде тандама мәтін арқылы зерттеу одісін де пайдаланып отырдық. Егер жиілік сөздік таңдама одісі арқылы алынатың болса, онда алынған статистикалық модсль түпнүсқасының ерекшеліктсрін қаншалықты қамти алатындығы жайлы сүрақ туындайды. Мүндай жағдайда алынған мотіншн (таңдаманың) өз түпнүсқасына сәйкестілігі болса, онда бүл таңдаманың дүрыс алынгандығын көрсетеді. Алынған жиілік сөздіктің сапасын көрсететін екінші бір жағдай - тізімге (рссстргс) алыиған -өздердің әлі зерттелмеген, жаңа мәтіндерде қаншалықты кездссіп отыратындығы.
^ерттеуімізге негіз етіп алынган 50 жылдардағы БСО мөтіндерін У/0-2000 жылдардағы БСО жонс БӘ мотіндсрімен салыстыруда осы
23
жағын да ескердік. Алфавитті-жиілік сөздікте белгілі бір зерттеугс алынған мәтін көлеміндсгі сөздердің не олардың түлгаларының қодданылу жиілігі көрсетілс отырып, алдыңғы әріптсрі бойынша кдтаң әліпби тәртібімен берілсді. Жиілік сөздіктің бул түрі зерттеугс кджет болған лексикалық топтарды оңай ажыратуға, ондагы ксрек сөздерді тез тауып алуға, қаралып отырған мәтіннің стильдік сапасын тандауға, зерттеугс алынған шығарма тілінің лексикалық байлығы мен оны жазған автордыд соз қолданысындағы тілдік срскшсліктерді сонымен бірге шеберлігн білуғс, дублст сәздердің кай нүсқаларының жиі, ал қай нүскдларының сирек қолданылатындығын білу арқылы олардың орныкдылығын аныктауға, жарыса қолданылатын сездердің кдй нүсқаларының әдеби нормадан шығатындығын аныктауға жәрдемдеседі [16; 17; 76,143]. Жиілік сөздік белгілі бір зерттеугс алынған мәтіндегі сөздердің, не" оның түлғаларының қолданылу жиілік санына қарай қатаң кемімелі тәртіппен орналасқан тізбесі болып саналады. Егер мунда сөздер мен оның түлғаларының қолданылу жиілік саны бірдей болып келсе, онда олар алфавитті-жиілік сөздіктегідей алдыңғы оріптері бойынша қатаң оліпби тәртібімен беріледі. Ал снді ксрі алфавитті-жиілік сөздіктер бслгілі бір зерттеу ыысанасындагы мәтін қүрамындағы сөздердің, оның түлғаларының соңғы оріптері бойынша қатаң әліпби тортібімен берілетін, мәтіндегі жиілігі қоса көрсетілетін түрі екені белгілі [16; 17; 76,144]. Жиілік сөздіктің бул түрі зерттеушіге сәздің негізғі бөлшектерін ажыратып тануға және ол бөлшектердің қолданылуына талдамалар жасауға мүмкіндік береді.
1-кесте - 1950-2000 ж.ж. БСО мен БӘ мәтіндері бойынша пайдаланылған материалдар
Сөздік аттары
|
Соз қолда ныс
|
Абсолютті жиілік
|
Создік авторы
|
N
|
Ғ с/ф
|
Ғ сөз
|
1. Балалар әдебисті (60-70
|
97260
|
25365
|
10077
|
Молдабск
|
2. 50 ж. БСО мотіндсрі
_1_£ЬШЫП
|
24385
|
8374
|
3126
|
Қалыбсков
|
2 сынып
|
44125
|
12885
|
6513
|
|
3 сынып
|
117451
|
25716
|
9344
|
|
Жалпы келемі
|
185961
|
34522
|
10298
|
|
•*• 70 ж. БСО мәтіндері:
|
40710
|
9792
|
3624
|
Молдабск
|
2 сынып
|
93474
|
13869
|
7409
|
|
3 сынып
|
112976
|
27325
|
10397
|
Жалпы көлемі
|
241984
|
38445
|
12281
|
~Х~90~ж. (1-4 сынып)
|
226374
|
39950
|
12813
|
Мамаев
|
5. Өзбек газет мәтіндері
|
209485
|
35908
|
-
|
Мухамедов
|
6. Өзбек балалар әдебиеті
|
100000
|
26752
|
-
|
Ризаев
|
7. Түрік газеттері
|
100000
|
23273
|
-
|
Бабанаров
|
'~8ГҚаракдлпақстан газеті
|
100000
|
-
|
-
|
Айымбетов
|
9. 2000 ж. БСО мәтіндері
|
368965
|
40142
|
13869
|
Ермекбаев
|
Сонымен бірге ол мәтіндердегі сөз тудырушы және сез түрлендіруші қосымшаларды қиындықсыз тез тауып алуға көмектеседі. Бүларға қоса, кері алфавитті-жиілік сөздіктегі сөз тұлғаларының соңғы әріптеріне қарай бірыңғайласып тәртіппен орналасуы зерітеушіге омонимдес қосымшалардың сыңарларын бір-бірінен ажырата білугс де септігін тигізеді. Ал, олардың мәтіндегі қолданысын керсстетін жиілік көрсеткіштері ол қосымшалардың тұрақгы-тұрақсыздығы, өнімді-өнімсіздігін, нормалану жағдайындағы ерекшелік сипатын анықтауға жәрдсмі тиеді.
2-кестс — 50-70 ж.ж. БСО мәтіндерінің орбір пән бойынша сөзбен қамтылу статистикасы
к/с
|
Окулықгардың аты
|
Абсолютті жиілік
|
|
70 жылдардағы оқулықтар
|
Ғс/қ
|
Ғс/ф
|
Ғсоі
|
1
|
Балалар әдебиеті
|
100000
|
25365
|
10077
|
2
|
Әліппе, 1975.
|
2536
|
1588
|
992
|
3
|
Қазақ тілі (1 сынып, 1972)
|
8910
|
2867
|
1454
|
4
|
Ана тілі (1 сынып, 1972)
|
11865
|
5081
|
2236
|
5
—
6
|
_Математика (1 сынып, 1972)
|
17399
|
2443
|
1044
|
Қазақтілі (2 сынып, 1973)
|
13993
|
4649
|
1926
|
7
|
Ана тілі (2 сынып, 1973)
|
4?777
|
13561
|
5632
|
8
|
Математика (9 сынып, 1979)
|
99495
|
3394
|
1221
|
! 9 10 11
- —
12 13
—■
|
_Табиғат тану (2 сынып, 1972)
|
14289
|
5265
|
2332
|
^Сдзақтілі (3 сынып, 1975)
|
20857
|
6076
|
2730
|
_Ата_тілі (3 сынып, 1975)
|
51462
|
15360
|
7495
|
і^атематика (3 сынып, 1972)
|
22899
|
3668
|
1297
|
_іабиғат тану (3 сынып, 1974)
|
17758
|
6221
|
2775
|
^У_жылдардағы оқулықтар
|
|
|
|
-&за]ітш_(1 сынып, 1953)
|
6314
|
2480
|
1024
|
^Шіфметика (1 сынып, 1959)
|
7391
|
2080
|
721
|
25
" 16
|
Ана тілі (1 сынып, 1957)
|
10680
|
3814
|
1381
|
17
|
Қазақ тілі (2 сынып, 1952)
|
8035
|
3794
|
1938
|
Т8
|
Арифметика (2 сынып, 1958)
|
11058
|
2822
|
827
|
~~Т9
|
Ана тілі (2 сынып, 1953)
|
25032
|
6269
|
3748
|
20
|
Қазақ тілі (3 сынып, 1951)
|
12524
|
5219
|
2009
|
21
|
Арифметика (3 сынып, 1959)
|
13021
|
3028
|
915
|
22
|
Ана тілі (3 сынып, 1953)
|
47509
|
9131
|
4092
|
23
|
Тарих (3 сынып, 1958)
|
15139
|
4319
|
127^
|
24
|
Табиғат тану (3 сынып, 1952)
|
29258
|
4021
|
2010
|
1-кестеден көрініп түрғандай, 50 және 1970-2000 жылдардағы БСО мәтіндері мен БӘ әр түрлі көлемдегі сөздер мен сөз формаларының және сөз қолданыстардың шамасын аңғартады. 50 жылдардағы оқулық мотіндерінде 1970-2000 жылдардағы мәтіндерге қарағанда сөздер мен сез қолданыстар және сөз формалары аз қолданылған. Бүдан байқайтынымыз, таңдама көлсмі үлгайған сайын, мәтіннің сөзбен қамтылу коэффициенті де осіп отырады. Агглютинативті тілдерде одстте бүл коэффициент 90% шамасында болады [16,44].
2-кестегс қатысты деректерге келсск, 50 жәнс 70 жылдардагы БСО мәтіндерінің әрбір сыныпқа қатысты пәндері боііынша сөз, сөз формасы мен сөз қолданыстармен қамтылуының көрсеткіштері берілді. Мүндағы әрбір сыныптагы пәндер арасында лексикалык түлғалармен қамтылуы жағынан 50 жоне 70 жылдар оқүлықтары арасында айтарлықтай айырмашылықтарды көреміз.
3-кесте - 50 ж. БСО мәтіндеріндегі лексика-грамматикалық топтардың қамтитын үлесі
Сөз таптары
|
Шартты белгілері
|
Пайызы
(%)
|
1. Зат есімдер
|
|
Достарыңызбен бөлісу: |