Оқулық мәтіндерінің жиілік құрылымының ерекшеліктері II. Жиі қолданыстағы сөздер


-2000 жылдардағы БСО мен БӘ жиі қолданыстағы сөздермен қамтылуы



бет3/8
Дата24.02.2016
өлшемі1.06 Mb.
#11784
түріОқулық
1   2   3   4   5   6   7   8

1950-2000 жылдардағы БСО мен БӘ жиі қолданыстағы сөздермен қамтылуы.


Жиілік сөздіктер

N

L

1-500

1-500

1-1000

1-2000

1-3000

1. Балалар әдебиеті

97260

1106 8

25,1

47,5 4

59,4

1


72,04

80,00

2. 50 ж. БСО

185961

1029 8

38, 51 5

66,1

7


77,57

87,07

91.38

3. 70 ж. БСО

241984

1228 1

41,8

7


70,5

83,29

88,76

90,08

4. 90 ж. БСО

226374

1281

3


39,4 1

68,1

1

79,51

84,17

91,12

5. 2000ж.БСО

386965

1386 9

38,6

2


70,8 4

81,63

82,61

93,33

6. Абай жолы (1-4 т.)1

465591

1718 8

39,2 0

68,0

2


71,55

79,92

84,00

7. Газеттер(публ и-цистикалық)

146764

1242 3

31,4 0

59,7 4

72,85

83,88

88,88

8. Өзбек көркем' әдебиеті

95550

8052

44,8 1

68,1 8

77,83






9. Өзбек тіліндегі газетгер

209485

1299 6

35,1 9

62,9 8

75,14

85,47



10. Орыс әдебиеті (Пушкин)

544777

2119

7







70,00







11. Орысша сөздік (Засорина, 1966)

120843

1420 6

28,8 9

47,6 1

58,00

69,01

76,50

Егер 1000-ға дейінгі аумақта БӘ жиі кездесетін лексикалық бірліктер мәтіннің 59% үлесін қамтыса , 50 жылдардағы оқулықтарда 78%, 70 жылдардағы оқулықтарда 83%, 90 жылдардағы оқулықтарында 79% 2000 жылдардағы оқулықтарда 82%, өзбек тілінде 68% үлесті қамтыса, ал флективті орыс тілінде бұл аумақтағы лексикалық бірліктөр мәтіннің 58%-ын құрал, агглютинативті тілдердің көрсеткіштеріке шамалас деңгейден көрінеді. Бұл жерде мәтіннің сөзбен қамтылуындағы айырмашылық тілдердің типтік белгілеріне қарай емес, стилі мен тақырыптық айырмашылықтарына байланысты. Мысалы, 50ж.және 70ж. Мектеп оқулықтарына қарағанда сөздік қоры бай БӘ бұл аумақтағы лексикалық бірліктермен қамтылуы өте төмен (59,41 %). Бұған керісінше, онымен салыстырғанда сөздік қоры жұтаңдау болып келетін 1950-2000ж.ж. БСО мәтіндері жиі кездесетін сөздермен қамтылудың өте жоғары дәрежесін көрсетеді (78%-83%).

2. Барлық тілдер бойынша алынған мәтіндердің жілік сөздіктері түрлі аумақтар бойынша сөзбен қамтылудың шамамен алғанда бірдей дәрежедегі өсу қарқынын байқатты. Қазіргі таңдағы статистикалық ақпараттың тәжірибесі мәтіннің статисикалық құрылымы жайында алынған нәтижелерді дәлелді түрде бағалауға мүмкіндік беретін көптеген әдістерге бай екені белгілі.

Әдетте статистикалық құрылымы ретінде мәтіндегі сөздер саны мен олардың мәтінде көрінетін жиілігі арасындағы қарым-қатынасты айтатыны белгілі. Мәтіннің статистикалық құрылымының моделі ретінде сөздік тізіміндегі сөздің рангісі мен оның жиілігі арасында кері тәуелділік қалыптасатын жиілік сөздіктерді санауымызға болады. Аталған тәуелділікті дәлелдеу бағытындағы зерттөудің бастыларының бірі - Эсту-Ципф-Мандельброт заңы. Бұл заңның негізін қалаушы француз ғалымы Эсту 1916 жылы стенографияны жетілдірумен айналысу барысында ранг-жиілік тәуелділігін байқады. Кейінрек бұл заң ЦИПФ, Мандельброт тағы басқа ғалымдармен дәлелденіп, толықтырылып "Эсту-Ципф - Мандельброт заңы" деген атқа ие болды.

Рангіден заң параметрінің функциональды тәуелділігін анықтау міндеті В.Калинин мен Э.Макаев еңбектерінде шешімін тапты. Бұл заң сөздің жиілігі мен жиілік тізіміндегі оның рангісі арасында кему жиілігі бойынша байланысты қалыптастырады және берілген рангі бойынша мәтіннен кездойсоқ алынған сөздің пайда болу ықтималдығын шамалап есептеуге мүмкіндік береді, яғни, сөз бен оның берілген реттік нөмірі арасындағы пропорцияны анықтауға жағдай жасайды. Заңның параметрлерін есептеу Ғі=І\ІК(і+р)~7 формуласымен өрнектеледі, мұндағы Ғ1 - тізімдегі сөздің (сөз формасының) абсолютті жиілігі, і -тізімдегі сөзфрдің (с/ф) реттік нөмірі, N - сөз қолданыстармен алғандағы таңдама көлемі; к,р,ү - заңның параметрлері.

К,р,ү - шамаларының тұрақты мәндерін анықтау арқылы зерттеуімізде БСО мен БӘ сөздердің қолданылу жиілігін оның рангісі бойынша және кері тәуелділік бойынша анықтап, оқулық мәтіндері мен БӘ статистикалық құрылымының ерекшеліктерін айқындадық. Ципф заңының параметрін (К) мына формулалармен анықтауға болады

К= Ітіп Fi /N

Мұндағы Ғі, — сөздің абсолютті жиілігі, imin минималды ранг, N - таңдама көлемі. Мандельброт заңының параметрін (ү)мына формула бойынша анықтауға болады:

ү = imax/ Fi m

Мұндағы Ғ^ - сөздің абсалютті жиілігі, осы жиіліктеп сөздердің (сөз формаларының) саны, I - максималды ранг. Параметрлерді есептеу Ғі = NK (і+р)ү формуласы бойынша ЭЕМ-да іске асырылды.







50 ж.

БСС

) мәтіндерінің жиілік

құрылымы.

Сөз

f

"1

№ қ/с

Сөз




ғ1

1. ол-м

3609




26

жат-е




751

2. де-е

3374




27

жаттығу-з




749

3. Бол-е

3142




28

ал-ш




747

4. да-ш

2301




29

қандай-м




747

5. Бір-а

2024




30

кет-е




742

6. бала-з

1769




31

ме-ш




742

7. е-е

1510




32

және -ш




726

8. Кел-е

1462




33

жаз-е




720

9. неше-м

1371




34

бар-е




717

10. Күн-з

1270




35

екі-а




710

11. ал-е

1256




36

үй-з




710

12. Сез-е

1120




37

екінші-а




684

13. тур-е

1124




38

ағаш-з




654

14. бар-д

1066




39

қой-е




647

15. не-м

1007




40

қара-е




615

16. бер-е

954




41

су-з




615

17. жүр-е

945




42

мына-м




601

18. біз-м

934




43

сан-з




596

19. бұл-м

902




44

жер-з




596

20. мен-м

870




45

оқы-с




596

21. сал-е

818




46

үшін-ш




584

22. айт-е

802




47

көр-а




580

23. шық-е

801




48

сал-е




563

24. де-ш

779




49

керек-ш




544

25. өз-м

760




50

жол-з




539

Онда жоғарыдағыдай ранг-жиілік тәуелділігінің кестесі берілді.



Бұл кестелер 50,70 жылдардағы БСО мен БӘ мәтіндерінің статистикалық құрылымын сипаттайтын негізгі кестелер болып табылады. Эсту-Ципф-Мандельброт заңының параметрлерін салыстыру 50-70 жылдардағы салыстырмалы түрдегі ұқсастықтарды анықтауға мүмкіндік береді.

70- ж. БСО мәтіндерінің жиілік сөздіктері бойынша құрылымынан үзінді


Сөз

Ғі

№ қ/с

Сөз

Ғі

1. ол-м

4982

26

неше-м

1125

2. бол-е

3736

27

де-ш

1102

3. де-е

2935

28

қал-е

'1083

4. бір-а

2188

29

қой-е

1075

5. е-е

2029

30

не-м

1072

6. сан-з

1965

31

ал-е

1033

7. шығар-е

1804

32

жүр-е

997

8. жаз-е

1798

33

біз-м

972

9. сөз-з

1707

34

мен-ш

970

10. кел-е

1705

35

екі-а

964

11. да-ш

1681

36

осы-м

926

12. және-ш

1677

37

оқы-е

922

13. бала-з

1445

38

сол-м

893

14. түр-е

1423

39

қандай-м

863

15. шық-е

1400

40

қанша-м

832

16. жаттығу-з

1315

41

ескінші-а

831

17. күн-з

1269

42

су-з

820

18. жер-з

1263

43

кет-е

792

19. бар-д

1250

44

екінші-а

787

20. бұл-м

1249

45

көр-е

792

21. бер-е

1208

46

үй-з

768

22. қара-с

1185

47

әр-м

744

23. айт-е

1162

48

сөйлем-з

729

24. мен-н

1154

49

отыр-е

728

25. өз-м

1145

50

ал-ш

691

Кестелерден көрінгендей, таңдама көлемі 185961 сөз ріданыс, 10298 сөзді қамтитын 50 жылдардағы БСО жиілігі ең жоғары ол, неше, не, біз, бұл, мен, өз, қандай, мына есімдіктері барлық таңдаманың 28, 20%-ын қамтитын 52448 сөз қолданыстағы реестрдің ең жоғарғы жағына орналасқан 50 сөздің 20,58%-ын қамтыса, етістіктердің ішінде де, бол, е, кел, ал, тұр, бер, жүр, қал, айт, шық, жат, кет, жаз, бар, қой, қара, оқы, көр, сал тұрғысындағы жиі қолданыстар 42,19%-ын, зат есімдердің ішінде күн, сөз, жалығу, үй, ағаш, су, сан, жер, жол тұлғасындағы жиі қолданыстар 13,05%-ын қамтиды. Көмекші сөздердің ішінде ең жиі қолданылатындары де, ал мен, және, үшін, керек шылаулары 12,24%-ын қамтыған. Ал бар атты Әртарап мағынаны білдіретін сөз 2,03%-ын алып тұр.

Бұл мысалдар арқылы 50 жылдардағы оқулық мәтіндерінің құрылымындағы берілген жиіліктегі сөз бөн оның рангісі арасындағы пропорцияны көреміз. Осы кестемен салыстыру мақсатында 70 жылдардағы оқулықтардың мәтіндеріндегі ең жиі қолданыстағы 50 сөзді алып, оларды жиілігі бойынша орналастырсақ, олардың жиілік қурылымындағы мынадай ерекшеліктерді байқаймыз:

Таңдама көлемі 241984 сөз қолданыс, 12281 сөзге тең 70 жылдардағы оқулық мәтіндеріндегі барлық сөздіктің 27,74%-ын қамтитын 67136 сөз қолданысқа тең 50 сөздің 22,17%-ын ол, мен, бұл, өз, неше, не, біз, осы, сол, қандай, қанша, әр есімдіктері, 39,21 %-ын бол, де, е, шығар, жаз, кел, тұр, шық, бер, айт, қал, қой, ал, жүр, оқы, кет, көр, отыр, етістіктері, 18,04%-ын сан, сөз, бала, жаттығу, күн, жер, есеп, су, үй, сөйлем секілді зат есімдер құраса, қалған 9,11%-ын да, және , де, мен, ал шылаулары, 5,86%-ын бір, екі, екінші сан есімдері, 5,86%-ын Өртарап мағынаны білдіретін бар сөз құрайды. Бұл мысалдар 70 жылдардағы БСО мәтіндерінің лексикалық бірліктермен қамтылуындағы өзіндік ерекшелігін көрсетеді.

Демек, өзге сөз таптарына қарағанда өмірдің түрлі саласындағы қат-қабат қолданысы айқын білінетін етістіктер алғашқы орында тұрса, баланың алғашқы сөйлеу әрекетіндегі негізгі сөздік қорын құрайтын есімдіктер одан кейінгі екінші орында, ал жалпы мәтіннің көлемі бойынша сөз қолданыс жөнінен алғашқы орындағы зат есімдер келтірілген үзіндіде үшінші орында тұр.

Өйткені, етістіктер лексика-семантикалық ерекшелігі жағынан, түбір тұлғасы мен оған үстелетін грамматикаліьіқ категорияларының қат-қабаттағы жағынан өте күрделі сөз тобының бірі. Енді осы лексикалық спектордың кестесін келтірейік




Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет