Б. З. Андасова, А.Ә. Шәріпбаев, Г. Комантай Қазақ мәтінін төте жазудан кирилл жазуына түрлендірудегі автоматтың жұмыс істеу моделі



бет1/2
Дата11.06.2016
өлшемі327.5 Kb.
#128462
  1   2

Б.З. Андасова, А.Ә. Шәріпбаев, Г. Комантай


Қазақ мәтінін төте жазудан кирилл жазуына түрлендірудегі автоматтың жұмыс істеу моделі


(Л.Н.Гумилев атындағы Еуразия ұлттық университеті, Астана қаласы)
Жұмыста төте жазумен жазылған қазақ тіліндегі мәтінді кирилл графикасына және керісінше түрлендіру үшін қолданылған ақырлы автоматтың жұмыс істеу моделі сипатталады. Автомат жұмысы қазақ тілінің сөздерді тануға негізделеді.

Қытай еліндегі қазақ диаспорасының жазбаша қазақ тілі Ахмет Байтұрсынұлы ыңғайлаған төте жазу әліпбиіне негізделген, ал Қазақстанда кирилл графикасы түріндегі жазу қолданылатындықтан, әртүрлі жазу графикасындағы қазақ мәтінін оқу ол жазуды білмейтіндер үшін көп қиындық тудырады. Бұл екі елдегі қандастарымыздың ақпарат алмасуына да кедергі келтіреді. Сондықтан да, қазақ мәтінін төте жазудан кирилл жазуына ақырлы автоматты қолданып аудару мәселесі бүгінгі күні өзекті болып табылады.

Ахмет Байтұрсынұлы қазақ тiлiнiң тоғыз дауысты (а-ә, ы-i, о-ө, ұ-ү, е) және он тоғыз дауыссыздан (б-п, д-т, г-к, ғ-қ, ж-ш, з-с, й, л, м, н, ң, р, у) тұратын дыбыс жүйесiн негiзге алып, араб әлiпбиiн пайдалана отырып қазақ әлiпбиiн жасады .

Ахмет Байтұрсынұлы ұсынған жазба тiл нормасы бiрыңғай халықтық тiлдiң сөз, грамматика, дыбыс жүйесiне сүйендi, соларды таяныш еттi, ескiтүркiлiк сөз үлгiлерi мен қалың жұртшылыққа түсiнiксiз араб, парсы элементтерiнiң қолданылуы шектеулi болды. Ахмет Байтұрсынұлы жазуы халықтық тiлдiң сөз үлгiлерiн жазба тiлде бiрiздi қолданудың жүйесiн жасады. Сөйтiп, Ахмет Байтұрсынұлы халық тiлiне негiзделген жазбаша тiлдiң тұңғыш рет оқулықта, оқу құралдарында заңдастырылған нормасын (кодификацияланған нұсқасын) жасады. Тiлiмiздiң заңдастырылған жазу нормаларын Ахмет Байтұрсынұлы негiздеп бердi.

Ахмет Байтұрсынұлы ұсынған жазу жүйесi жұртшылықтан қолдау тауып, оның бiр-екi айдың iшiнде-ақ үйренiп алатындай 24 әрiптен тұратын жүйесi ұғымға жеңiл, емлесi оңай болды. Жұртшылық сондықтан бұл жазуды бұрынғы жазудан бөлектеп, төте жазу, төте оқу деп атады. 1929 жылы қазақ жазуы латын графикасына негiзделген, 29 әрiптен тұратын жазуға көштi. Ал 1940 жылы қараша айынан бастап латын негiздi қазақ жазуы 41 әрiптен тұратын осы күнгi орыс графикасына бейiмделген жазуға көштi. Ал Қытай Халық Республикасындағы (ҚХР) қандастарымыз осы күнге дейiн төте жазуды қолданып келедi. Ол елде төте жазумен оқулықтар, оқу құралдары, газет-журналдар, әртүрлi кiтаптар шығады [2].

Ұсынылып отырған жұмыста төте жазумен жазылған қазақ тіліндегі мәтінді кирилл графикасына және керісінше түрлендіру үшін ақырлы автоматтар қолданылды. Әліпбилердегі әріптер саны тең болмағандықтан, бірмәнді емес түрлендіру процесі жүреді. Бұл өз кезегінде тану және аудару мәселелерін шешуді қажет етті. Бір графикадағы жазуды екіншісіне аудармас бұрын, сол әліпбидің символдарын автомат арқылы тану қажет болады.

Автомат – бұл қандай да бір жиынды анықтайтын алгоритм, мүмкін болған жағдайда ол жиынды басқа жиынға түрлендіруі мүмкін.

Автоматтардың формальсыз сипатталынуы келесі түрде болады: автомат кіру лентасынан, күйдің нөмерін сақтайтын ақырлы жадысы бар басқару құрылғысынан тұрады, сонымен қатар көмекші және шығыстық лентасы болуы мүмкін. Автоматтардың екі типі бар:



  • Танығыштар – шығыссыз автоматтар, олар кіру тізбегінің берілген L жиынына тиістілігін анықтайды.

  • Түрлендіргіштер – шығысы бар автоматтар, олар XL шарты орындалғанда X кіру тізбегін Y тізбегіне түрлендіреді.

Тілді тануды қамтамасыз ету үшін танығышты қолдану керек. Танығыш дегеніміз қандайда бір тізбелер жиынын анықтайтын алгоритм. Оны төрт бөліктен (кіріс таспасынан, бастиектен, жадтан, басқарушы құрылғыдан) тұратын абстракты құрылғының жұмысы арқылы сипаттауға болады.

Ақырлы автоматтар танығыштардың ішіндегі ең көп тарағаны болып есептелінеді және ол ақырлы кіріс таспасы мен жадтан, оң жақты бас тиектен және басқарушы құрылғыдан тұрады.

A = (K, ∑, δ, P0, F) түріндегі бестік ақырлы автомат деп аталады, мұндағы:

K – күйлердің ақырлы жиыны;

∑ – әліпби;

δ – өту функциясы;



P0 – бастапқы күй;

F – соңғы күйлердің жиыны.

Автоматты күйлерден, лентадан немесе бірнеше ленталарда жазылатын (оқылатын) символдардан және командалардың жиынтығынан тұратын формальды жүйе ретінде қарастыруға болады [3].

Ақырлы автоматтың жұмысы қадамдардың немесе тактілердің тізбегінің, такт басқарушы құрылымның кезекті жағдайымен және ену бастиегімен анықталады. Ал қадам жағдайлардың өзгеруінен және бастиектің бір ұяшық оңға жылжуынан тұрады.

Ақырлы автоматтың орындайтын келесі жұмыстарын анықтау үшін мыналарды ғана білу керек:


  1. басқарушы құрылымның кезекті жағдайын;

  2. кіріс таспасындағы бастиектің астындағы және оның оң жағында орналасқан символдардан тұратын тізбекті (конфигурация).

Информацияның осы екі элементі конфигурация деп аталатын ақырлы автоматтың сипаттамасын береді [3].

Ақырлы автоматтың жұмысын граф, өту кестесі, команда және өту матрицасы түрінде көрсетуге болады.


Кирилл және төте жазуларымен жазылған қазақ тіліндегі мәтіннен әріпті тануға негізделген ақырлы автоматтың жұмыс істеу моделі өту кестесі арқылы анықталып, төмендегі 1-ші кестеде көрсетілген. Автоматтың 5 күйі бар, q0 – бастапқы күй, q4 – ­соңғы , яғни автоматтың жұмысын тоқтату күйі, ал q1 – кіріс таспасындағы кезекті символды оқу күйі, q2 – бос символды оқу күйі, q3 – танылған символды екінші графикаға аудару күйі. Бұл автомат мәтіні әріп бойынша түрлендіреді.
Кесте 1 – Төте жазуды кирилл жазуына және керісінше әріп бойынша түрлендірудегі автоматтың жұмыс істеу моделі

КҮЙЛЕР

Кіріс таспасы

а

бос символ

q0 (бастапқы күй)

q1

q4

q1 (символды оқу күйі)

q3

q2

q2 (бос символды оқу күйі)

q1

q4

q3 (символды аудару күйі)

q1

q2

q4 (соңғы , яғни тоқтау күйі)

stop

stop

Кирилл және төте жазуларымен жазылған қазақ тіліндегі мәтіннен сөзді тануға негізделген ақырлы автоматтың жұмыс істеу моделі өту кестесі арқылы анықталып, төмендегі 2-ші кестеде көрсетілген. Бұл автоматтың 4 күйі бар, q0 – бастапқы күй, q3 – ­соңғы , яғни автоматтың жұмысын тоқтату күйі, ал q1 – кіріс таспасындағы кезекті символды оқу күйі, q2 – танылған сөзді екінші графикаға аудару күйі. Кіріс таспасынан енген кезекті символ бос символ болса, онда сөз соңы танылған болып саналады да, автомат жұмысы q2 аудару күйіне өтеді, аударып болған соң, соңғы күйге өтіп, жұмысын тоқтатады. Бұл автомат мәтінді сөз бойынша түрлендіреді.


Кесте 2 – Төте жазуды кирилл жазуына және керісінше сөз бойынша түрлендірудегі автоматтың жұмыс істеу моделі

КҮЙЛЕР

Кіріс таспасы

а

бос символ

q0 (бастапқы күй)

q1

q3

q1 (символдардың келу күйі)

q1

q2

q2 (аудару күйі)

q3

q3

q3 (соңғы (немесе тоқтау) күйі)

Stop

stop

Ал, осы төте жазумен жазылған мәтінді кирилл графикасына және керісінше түрлендірудегі аударудың күйінің өзі екі жағдайдан тұрады:



  • Төте жазуды кирилл жазуына аудару;

  • Кирилл жазуын төте жазуға аудару.

Төте жазуды кирилл жазуына аударуды қарастырайық, бұл процестің моделі төмендегі 3- кестеде көрсетілген. Төте жазумен жазылған ағымдағы символдың мәтіндегі кездесуінің 4 түрлі жағдайы бар: сөз басында, сөз ортасында, сөз соңында және жеке тұрғандағысы, байқасаңыз, барлығының кирилл жазуына аударылу нәтижесі бірдей.
Кесте 3 – Ахмет Байтұрсынұлы (төте жазу) әліпбиі әріптерін кирилл жазуының әріптеріне аудару моделі

Кіріс

таспасындағы символ

Жағдайлар

Сөз басы

Сөз ортасы

Сөз соңы

Жеке тұрғанда

ا (ﺍ ﺎ)

а

а

а

а

ءا(ﺍ ﺎ)

ә

ә

ә

ә

ب (ﺑ ﺒ ﺐ ﺏ)

б

б

б

б

ﺃ ( ﺄ ﺃ)

в

в

в

в

گ (ﮔ ﮕ ﮓ ﮒ)

Г

г

г

г

ع (ﻋ ﻌ ﻊ ﻉ)

ғ

ғ

ғ

ғ

د (ﺩ ﺪ)

д

д

д

д

ة (ﺓ ﺔ)

е

е

е

е

ج (ﺟ ﺠ ﺞ ﺝ)

ж

ж

ж

ж

ز (ﺯ ﺰ)

з

з

з

з

ي (ﻳ ﻴ ﻲ ﻱ)

й

й

й

й

ك (ﻛ ﻜ ﻚ ﻙ)

к

к

к

к

ق (ﻗ ﻘ ﻖ ﻕ)

қ

қ

қ

қ

ل (ﻟ ﻠ ﻞ ﻝ)

л

л

л

л

م (ﻣ ﻤ ﻢ ﻡ)

м

м

м

м

ن (ﻧ ﻨ ﻦ ﻥ)

н

н

н

н

ث (ﺛ ﺜ ﺚ ﺙ)

ң

ң

ң

ң

و (ﻭ ﻮ)

о

о

о

о

ءو (ﻮ ءو )

ө

ө

ө

ө

پ (ﭘ ﭙ ﭗ ﭖ)

п

п

п

п

ر (ﺭ ﺮ)

р

р

р

р

س (ﺳ ﺴ ﺲ ﺱ)

с

с

с

с

ت (ﺗ ﺘ ﺖ ﺕ)

т

т

т

т

ؤ (ﺅ ﺆ )

у

у

у

у

ذ (ﺇ ﺈ)

ұ

ұ

ұ

ұ

ءذ(ﺈ ءﺇ )

ү

ү

ү

ү

ف (ﻓ ﻔ ﻒ ﻑ)

ф

ф

ф

ф

ح (ﺣ ﺤ ﺢ ﺡ)

х

х

х

х

ه (ﻫ ﻬ)

һ

һ

һ

һ

ﭺ(ﭺ ﭻ ﭽ ﭼ)

ч

ч

ч

ч

ش (ﺵ ﺶ ﺸ ﺷ)

ш

ш

ш

ш

ئ(ﺉ ﺊ ﺌ ﺋ)

ы

ы

ы

ы

ءئ(ﺉ ﺊ ﺌﻇ )

і

і

І

і

Ал керісінше түрлендіру барысында, яғни кирилл графикасының әріптерін Ахмет Байтұрсынұлы (төте жазу) әліпбиі әріптеріне аудару моделі төмендегі үш түрлі жағдайдан тұрады:



  1. Әріптің «Сөз басы» және «жеке тұрғандағы» жағдай (4-кестеге қараңыз).

  2. Әріптің «Сөз ортасындағы» жағдайы (5- кестеге қараңыз).

  3. Әріптің «Сөз соңындағы» жағдайы (6-кестеге қараңыз) .


1.Кирилл жазуын төте жазуға аударудағы «Сөз басы» және «жеке тұрғандағы» жағдайы.
Кесте 4 – Кирилл жазуын Ахмет Байтұрсынұлы (төте жазу) жазуына аудару моделіндегі «Сөз басы» және «Жеке тұрғанда» жағдайлары

Кирилл жазуы

Төте жазу

Кирилл жазуы

Төте жазу

Әріп

Сөз басы

Жеке тұрғанда

Әріп

Сөз басы

Жеке тұрғанда

А

ا

ا

О



و

Ә

ءا

ءا

Ө

ءو

ءو

Б



ب

П



پ

В





О



و

Г



گ

Р



ر

Ғ



ع

С



س

Д

د

د

Т



ت

Е

ة

ة

У

ؤ

ؤ

Ж



ج

Ұ



ذ

З



ز

Ү

ءذ

ءذ

Й



ي

Ф



ف

К



ك

Х



ح

Қ



ق

Һ



ه

Л



ل

Ч





М



م

Ш



ش

Н



ن

Ы



ئ

Ң



ث

І



ءئ


2. Кирилл жазуын төте жазуға аударудағы «Сөз ортасы» жағдайы.
Кесте 5 – Кирилл жазуын Ахмет Байтұрсынұлы (төте жазу) жазуына аудару моделіндегі «Сөз ортасы» жағдайы




а

ә

б

г

ғ

д

е

ж

з

й

к

қ

л

м

н

о

п

с

т

у

ұ

ш

ы

і

а

ا

ا







ا

ا



ا







ا





ا







ا

ا







ә

ءا

ا







ا

ا



ا







ا





ا







ا

ا







б

















































в

















































г

















































ғ

















































д

د

د







د

د



د













د







د

د







е

ة

ة







ة

ة



ة













ة







ة

ة







ж

















































з

















































й

















































к

















































қ

















































л

















































м

















































н

















































ң

















































о

















































ө

















































п

















































р

















































с

















































т

















































у

ؤ

ؤ







ؤ

ؤ



ؤ













ؤ







ؤ

ؤ







ұ

















































ү

















































ф

















































х

















































һ

















































ч

















































ш

















































ы

















































і



















































Достарыңызбен бөлісу:
  1   2




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет