Баекеева айнур толыбаевна


Көптілді интероперабельді басқарылмалы тезаурус құрастыру әдістемесін аударматану ғылымына бейімдеу



бет34/41
Дата07.10.2022
өлшемі6.11 Mb.
#462141
1   ...   30   31   32   33   34   35   36   37   ...   41
baekeeva a t -povtor phd (s sop pis)

2.2.2 Көптілді интероперабельді басқарылмалы тезаурус құрастыру әдістемесін аударматану ғылымына бейімдеу


Тау‑кен терминдерінің көптілді басқарылмалы интероперабельді тезаурусын құрастыру тәжірибесін негізге ала отырып, басқа да пән салалары бойынша тезаурус құрастыруды ұйымдастыру мақсатында салалық аудармашыларға бейімдеп қадамдық алгоритм жасадық.
Тау‑кен терминдерінің көптілді басқарылмалы интероперабельді тезаурусын құрастыру мен сөздік мақалаларды редакциялау бойынша алгоритмін бастайық.
Сөздік мақалаларды енгізу үшін ең алдымен тезаурусқа енгізілетін терминдер іріктеліп, жинақталады. Сонан соң жинақталған терминдер тобы шартты түрде иерархиялық жіктеме бойынша топтастырылады. Әрбір терминге қажетті ақпарат жинақталады. Авторлық құқық иесі ЕТИ РҒА СБ әкімшісімен келісіп тезаурустың веб‑парағында басты терминдер орнатылады. Сонымен тезаурустың сөздік мақалаларын енгізуді бастаймыз:

  1. Ең алдымен біз тезаурус орналасқан Ресей Ғылым академиясының Сібір бөлімшесінің Есептеу технологиялары институтында құрастырылған (ЕТИ РҒА СБ) Digital Library платформасының веб-парағын ашамыз (сурет 16): http://db4.sbras.ru/elbib/data/admin/adm.phtml.






Сурет 16 – Digital Library платформасының веб-парағы

Ескерту – Әдебиет негізінде құралған [118]




Авторлық құқық иесі ЕТИ РҒА СБ әкімшісі тезаурус құрастыру құқығын берген «Логин» (пайдаланушы аты) және «Пароль» енгіземіз (сурет 17).





Сурет 17 – Digital Library платформасының веб-парағына кіру

Ескерту – Әдебиет негізінде құралған [118]





  1. Біз Digital Library жүйесінде әріптестеріміздің жасаған немесе әзірлеп жатқан тезаурустарын көре аламыз, бірақ оларды өзгертуге құқымыз жоқ. Өзгертулер мен түзетулер енгізу құқығы тек қана өз жобамыз үшін ғана берілген. Біз өзіміздің әкімшілік құқығы берілген тезаурусты таңдаймыз. Тезаурустың әлі процестегі жұмыс атауы «Тезаурус для Айнур» деп аталады. Барлық жобамызға сәйкес жазбаларды енгізуге, редакциялауға және қажет болған жағдайда жоюға рұқсат берілген. Жоғарыда аталған тезаурус атауы бойынша «Жинақты қарау ‑ Посмотреть коллекцию» батырмасын басамыз (сурет 18).






Сурет 18 – Digital Library платформасының веб-парағынан жинақты қарау

Ескерту – Әдебиет негізінде құралған [118]





  1. Ашылған терезеден «Жаңа құжат енгізу – Ввод нового документа» батырмасын басамыз.

  2. «zthe_cat (id = 82) жинағына жаңа құжат енгізу» айдарымен ашылған парақша ашылады (сурет 19).






Сурет 19 – Digital Library платформасының веб-парағындағы жинаққа жаңа құжат енгізу

Ескерту – Әдебиет негізінде құралған [118]





  1. Енді нақты термин кіргізу парақшасына кірдік. Әрі қарай әр терминді енгізуге қойылатын негізгі талаптарының әр қадамына назар аударайық. Мұндағы міндетті толтыруға қажетті өрістер қызыл қаріппен «[*]» белгісі арқылы берілген (сурет 20).






Сурет 20 – Digital Library платформасының веб-парағындағы жинаққа жаңа құжат енгізудің өрістері

Ескерту – Әдебиет негізінде құралған [118]





  1. Осы парақшаның ішіндегі қажетті өрістерді толтырамыз. Тезаурус толтыру кезінде сөзіміз көрнекті болуы үшін мысал ретінде «Зүбәржат» терминін негізге алайық. Терминнің ішкі мазмұнын толтырудың қадамдық алгоритмі визуалды түрде жеңіл болуы үшін кесте ішінде қарастатын боламыз (кесте 22):



Кесте 22 – «Зүбәржат» терминін Zthes деректер схемасы негізінде жасалған Digital Library басқарылмалы интероперабельді тезаурусына енгізудің қадамдық алгоритмі





Нұсқаулық атауы





Ұяшыққа енгізуге қажетті ақпарат



1

2



Зүбәржат






Бұл нөмір әр терминге автоматты түрде тіркеледі.

22-кестенің жалғасы




1

2





Зүбәржат – минерал, берилдің мөлдір түрі; Cr3+ (2%-ға дейін) қоспасымен қанық жасыл түске боялған. 1-класты асыл тас; массасы 5 караттан артық мінсіз кристалдары көлемі осындай алмастардан қымбат.
Жасанды зүбәржат кванттық электроникада қолданылады.





Терминнің номиналды формасы біз енгізген күйде автоматты түрде қабылданады. Ал терминге морфологиялық өзгерістер енгізу АЖ мамандарының еншісіне қалады. Мамандар морфологиялық анализатор бағдарламасының көмегімен бағдарламаға әр терминнің қандай қосымшалар арқылы жасалатыны турасында бағдарламалар жазады.






Біз қазақ тіліндегі терминді енгізіп жатқандықтан «kz» белгісін басамыз.





Алдын ала жасаған рубрикациямызға сәйкес «Минералды қорлар» басты терминіне қарасты термин екенін белгілейміз.





https://termincom.kz/search/?termin=%D0%B7%D2%AF%D0%B1%D0%B0%D1%80%D0%B6%D0%B0%D1%82&cid=0
Терминкомда белгіленген сөздікке сілтеме жасаймыз.






«add(NT)» белгісін басамыз.





:Минерал: деп жазамыз, мұнда әр енгізілген сөздің екі жағынан «:» белгісін қою міндеттеледі.





«Зүбәржат» термині иерархиялық жүйенің ең төменгі сатысында тұрғандықтан, аталған терминнің еншілес терминдерін көрсетпеуге болады.



:Берилл:



«Зүбәржат» терминінің аскрипторы, яғни жартылай синонимі жоқ.





Бір мағыналы термин болғандықтан «Зүбәржат» терминінің синонимі жоқ, сондықтан бұл өрісті бос қалдыруға болады.

22-кестенің жалғасы




1

2



«Зүбәржат» минералы берилл тобына жататын минералдар түріне жататындықтан, ассоциятивтік байланыс ретінде «:Берилл:» деп белгілейміз.





:Emerald:Изумруд:Cr3+:
Бұл өріске «Зүбәржат» терминінің ағылшын, орыс тілдеріндегі лингвистикалық баламаларын енгіземіз, сонымен бірге номенклатуралық атауын да енгізуге болады.





ГРНТИ классификаторлар коды ірі ғылым саласын сипаттауда қолданылады.





УДК (UDC) коды ірі ғылым саласын сипаттауда қолданылады.






Yes, яғни дұрыстығын растау үшін осы батырманы басамыз.






Терминді енгізуші әкімші құқығындағы тұлға автоматты түрде тіркеледі.



Автоматты түрде тіркеледі.



Автоматты түрде тіркеледі.



Мұнда қосымша мәтін беруге болады.

Ескерту – Автор құрастырған




  1. Осы кестеде көтерілген барлық ақпаратты жүктеп, дұрыстығына көз жеткізген соң «Жіберу – Отправить» батырмасын басамыз. Сонда аталған терминге автоматты түрде 264 нөмірлі идентификатор тағайындалды (сурет 21).




а
а –Термин енгізілген соң шығатын мәлімет


Сурет 21 – Digital Library платформасының веб-парағындағы жинақтағы жаңа құжатты жіберу, парақ 1



ә
ә – Термин өзгертілген соң шығатын мәлімет


Сурет 21 – Digital Library платформасының веб-парағындағы жинақтағы жаңа құжатты жіберу, парақ 2

Ескерту – Әдебиет негізінде құралған [118]




Осы кезде «Жазбаны көрсету – Показать запись» батырмасын басу арқылы жазбамыздың үлгісін көруге болады (сурет 22).





Сурет 22 – Digital Library платформасының веб-парағындағы жинақтағы жаңа құжатты енгізудің дұрыстығын тексеру

Ескерту – Әдебиет негізінде құралған [118]




Сонымен біз бір терминді стандарттар мен ережелерге сәйкес тезаурусқа енгізіп шықтық. Жұмысымызда ұсынып отырған тезаурусымыз көптілді тезаурус түріне жатады, сондықтан дәл осындай ретпен және тәртіппен ақпаратты ағылшын және орыс тілдерінде толтырып шықтық.
Мұндағы:
2‑бағандағы «Терминнің сипаттамасы» (SN Scope Note). Бұл өріс терминологиялық немесе салалық (түсіндірме) сөздіктен терминге анықтама береді.
3‑бағандағы «Терминнің атауы» (Міндетті өріс*). Мұнда терминнің атауы, қазақ, ағылшын және орыс тілдерінде әр терминнің ұяшығына бөлек­‑бөлек енгізіледі, _kz, _ru, _en біліктілік белгісі арқылы көрсетіледі.
6‑бағандағы «Терминнің қалыпты формасы» (Міндетті өріс*). Мұнда лемма сөздік жазбасының мерзімі үшін көрсетілген. Т. Батура [210, б. 15] «зат леммасы – бұл жекеше және номинативті жағдайдағы сөздің түрі» деген анықтама береді. Бірнеше сөздердің жиынтығын қамтитын күрделі терминдер леммасына түсу оның құрамына кіретін әр сөздің лемматизациясын азайту арқылы жүреді.
7‑бағандағы «Термин тілі» (Міндетті өріс*). Контекстік мәзірде тезаурус жазбасының, яғни енгізіліп отырған термин тілін таңдау қажет:

  • ru (орыс тілі үшін);

  • kz (қазақ тілі үшін);

  • en (ағылшын тілі үшін);

  • de (неміс тілі үшін);

  • fr (француз тілі үшін).

9‑бағандағы «Термин типі» (Міндетті өріс*). Терминдердің бір түрі тізімнен таңдалады (Осы ұсынылып отырған жоба аясындағы тезаурусымыздың Қазақстандағы кеңесшіміз, ақпараттық жүйелер саласының маманы, философия докторы (PhD) М. Самбетбаеваның кеңесі бойынша «add (NT)» таңдаймыз:
main (TT) – жоғары деңгей термині өте сирек негізгі категорияларды сипаттау үшін таңдалады. Біздің тау‑кен терминдерінің тезаурусындағы жағары деңгейлі терминдерге Тау‑кен ісі, Металл, Минерал, Технологиялар, Құрылғылар болып табылады.
add (NT) – неғұрлым тар термин, әдетте бір мағыналы, біздің тезаурусымыздың басым көпшілігін терминдердің осы түрі құрайды.
info (ND) – негізгі термин емес, қосымша ақпарат алу үшін енгізілген термин. Біз тезаурусымызда терминжүйе емес, терминологияны қарастырып отырғандықтан, тезаурусқа тек қана тексеруден өткізілген, қабылданған және бекітілген терминдерді ғана енгіземіз.
inval (NL) – фиктивті немесе жалған термин. В. Лейчик термин‑фикциясына сәйкес келетін кәсіби ауызекі тілде қолданылатын, кәсіби жаргонмен ара‑жігін ажырату қиынға түсетін термин түрі. Аталған тезаурусымыз машиналық аударма мен оны қолданушылардың қызметіне бағытталғандықтан, жұмысымызда терминдердің бұл түрін, яғни термин екені сенімсіз лексикалық бірліктерді енгізбейміз.
25‑бағандағы «Сөздікке сілтеме». Бұл баған тезаурустың сөздік мақаласын құрастыру мақсатында негізге алынған немесе пайдаланылған сөздікке сілтеме береді.
10‑бағандағы «Басты терминдер тізімі (BT)» иерархиялық байланыс категориясына тиесілі. BT – broader term, яғни терминнің иерархиялық сатысы бойынша жоғарғы қабатында тұратын термин.
11‑бағандағы «Еншілес терминдер тізімі (NT)» иерархиялық байланыс категориясына тиесілі. NT – narrower term, яғни терминнің иерархиялық сатысы бойынша төменгі қабатында тұратын термин.
12‑бағандағы «USE терминдер тізімі, дескрипторлар».
13‑бағандағы «UF терминдер тізімі, аскрипторлар», жартылай немесе толық емес синонимдер.
14‑бағандағы «Синонимдер _SYN» немесе толық синонимдер.
15‑бағандағы «Ассоциативті байланыстар тізімі _RT» терминнің қандай да бір басқа терминдермен немесе ұғымдармен ассоциативті байланысын анықтайтын терминдер тізімдері кіреді.
16‑бағандағы «LE лингвистикалық баламалар» мен 2‑бағандағы «Терминнің сипаттамасы» (SN Scope Note) ұсынып отырған көптілді тезаурусымыздың аудармашыларға қызмет етуінің басты негізі болып саналады, себебі осы өрістерде терминдер туралы ақпараттың қазақ, ағылшын және орыс тілдеріндегі аударма баламалары ұсынылады. Бұл өрістің басты айырмашылығы – бағдарламадан аударма баламаларының дәл табылуы үшін, яғни негізгі терминдегі лингвистикалық баламалар мен аударма баламаларының тура сәйкестігін қамтамасыз етуінде. Егер бір әріп немесе белгіден қате кетсе, онда гиперсілтемеде көрінбейді. Сондықтан тезаурус толтыру өте тыңғылықты еңбекті қажет етеді.
16‑бағандағы «Толтырылған жазбаның дұрыстығы» (Міндетті өріс*) өрісінде енгізілген ақпаратты түбегейлі тексеріп, дұрыстығын растаймыз:

  • «Y» - yes;

  • «N» - no;

  • «D».

Негізінен бұл өріс тезаурус толтырушыны тексеру барысында қажет. Редактор сөздік жазбаның дұрыс толтырылмағанын көрсетіп, «N» деген белгі қоя алады. Тезаурусты толтырушы әкімшінің парақшасында «Y» жазбасы автоматты түрде шығады, себебі тезаурус толтырушы әкімші болып арнайы пән саласының маманы тағайындалады.
Төменде жазбаның енгізілген күні, жазбаның өзгертілген күні (жазбаны редакциялау) туралы мәліметтер автоматты түрде көрсетіледі. Бұл нақты, кейінірек орындалған және нәтижелер сақталған жағдайда өте тиімді. Жазба иесін көрсету, яғни тезаурустың авторы және жазбаны түзетушіні көрсету кейінірек сөздік жазбасындағы өзгертулердің хронологиясы үшін маңызды. Автордың өзі немесе жүйеде осы тезаурусты өзінің аккаунты арқылы енгізуге құқылы редактор өзгерістер мен түзетулер енгізе алады.
Сонымен осындай қадамдарды орындап болған соң ғана «Жіберу» батырмасы арқылы автоматты түрде құжатты сақтаймыз. Енгізілген сөздік мақалалардың сыртқы беті, яғни қолданушыға көрсетілетін нұсқасы төмендегі суретте берілген (сурет 23).





Сурет 23 – Digital Library жинақтамасындағы тау-кен терминдерінің тезаурусындағы «Зүбәржат» терминінің қазақ тілінде толтырылған сыртқы беті

Ескерту – Әдебиет негізінде құралған [118]




Сонымен біз бір терминді стандарттар мен ережелерге сәйкес тезаурусқа енгізіп шықтық. Терминдерді енгізу кезіндегі басқа тілдегі тезаурусқа енгізілмеген баламаларды ашып көру мүмкін емес, яғни олардың тек сыртқы бетін ғана көре аламыз. Барлық терминнің гиперсілтемесі болуы үшін, ағылшын және орыс тілдеріндегі ақпаратты енгізуіміз қажет. Жұмысымызда ұсынып отырған тезаурусымыз көптілді тезаурусқа жатады, сондықтан тұрақты ретпен және тәртіппен ақпаратты ағылшын және орыс тілдерінде толтырып шығамыз. Сөзімізді қайталамас үшін назарларыңызға ағылшын және орыс тілдеріндегі толтырып болған нәтижесін көрсетейік (суреттер 24, 25).





Сурет 24 – Digital Library жинақтамасындағы тау‑кен терминдерінің тезаурусындағы «Зүбәржат» терминінің ағылшын тілінде толтырылған сыртқы беті
Ескерту – Әдебиет негізінде құралған [118]





Сурет 25 – Digital Library жинақтамасындағы тау‑кен терминдерінің тезаурусындағы «Зүбәржат» терминінің орыс тілінде толтырылған сыртқы беті

Ескерту – Әдебиет негізінде құралған [118]




Жоғарыдағы визуалды ақпарат көрсетіп отырғандай, «Зүбәржат» терминінің тезаурусқа ағылшын және орыс тілдеріндегі ақпараттарын енгізіп шыққанда ғана, гиперсілтемелер жұмыс жасай бастады. Кез келген лингвистикалық балама батырмасын басу арқылы дәл сол тілдегі термин туралы толық тезаурустық ақпаратқа қол жеткіземіз. «Зүбәржат» терминінің ассоциативті байланысы болып табылатын «Берилл» термині туралы ақпарат тезаурусқа әлі енгізілмегендіктен, аталған термин туралы гиперсілтеме әзірше толыққанды қызмет етпейді, яғни тезауруста «Берилл» терминіне қатысты сипаттама енгізілмеген (сурет 25). Сондықтан осы терминді, жоғарыдағы мысал бойынша тағы да үш тілде толтырып шығамыз.
Көптілді тезаурустарды құрастырудың басты қиыншылығы да осында. Терминдердің автоматтандырылған іздеуде дұрыс жұмыс жасауы үшін, әр терминге қатысты ақпаратты қолмен толтыру қажет. Жұмысымызда үш тілді қарастырғандықтан, тезаурусты толықтыру жұмысы үш есеге ұлғайып отыр. Бұл еңбектің нәтижесі аудармашылар үшін құнды деп есептейміз.
Жасалған сөздікке басқа тілдердегі баламаларды енгізу нұсқаулығы тура жоғарыда аталған «Зүбәржат» терминінің мысалы арқылы жасалған нұсқаулықпен сәйкес келеді. Осыдан кейін басқа тілдердегі сөздік жазбасының баламалары енгізіледі, егер мақаланың түпнұсқасы қазақ тілінде болса, параллель деректер сәйкесінше ағылшын, орыс тілдерінде беріледі.
Осы Digital Library негізінде жасалған басқарылмалы сөздіктің ең бір артықшылығы – кез келген уақытта пән салаларының мамандарымен бірігіп сөздік мақалаларға өзгертулер мен толықтырулар енгізуге болады, яғни басқарылмалы тезурус мамандардың (адамның) басшылығымен жүзеге асырылады және басқарылады.
Тезаурустың сөздік жазбасын редакциялау үшін негізгі бетте барлық енгізілген атаулар мен терминдердің (дескрипторлар) тізімінен қалаған терминімізді таңдаймыз, оның астындағы «өңдеу» батырмасын басып және тиісті бағанға қажетті өзгерістер мен толықтыруларды енгізіп, содан кейін «Өзгерту» батырмасын басу арқылы өзгерістерді сақтаймыз. Өзгерістердің нәтижелерін «Өңдеу нәтижелерін көрсету» батырмасын басу арқылы көруге болады.
Салалық терминдердің көптілді басқарылмалы тезаурусын құрастырудың қадамдық алгоритмін біз үш тіл арасында аударма жасап жүрген тәжірибеші салалық аудармашыларға арнап жасадық. Мұндай ғылым мен техниканың пән саласындағы тезаурусты толтыруға құзыретті маман болуы шарт. Көптілді сала аудармашыларына арналған алгоритмнің қаншалықты түсінікті екенін тексеру мақсатында мамандардың кәсіби баға беруін сұрадық.
Осы орайда біз аталған қадамдық алгоритмді Л.Н. Гумилев атындағы Еуразия ұлттық университетінің Аударма теорисы мен практикасы кафедрасының докторанттары мен магистранттарына, ұлттық және трансұлттық компаниялардағы тәжірибеші аудармашыларға, министрліктер мен басқа да мемлекеттік органдардағы тәжірибелі тіл мамандарына ұсындық. Тезаурус толтырудың қадамдық алгоритмін зерделеп оқыған сала мамандарының кәсіби біліктілігінің сапалық және сандық көрсеткіші төмендегі кестеде берілген (кесте 23). Мамандардың аударма ісіндегі еңбек өтілі мен іс‑тәжірибесі 10 жылдан жоғары.

Кесте 23 – Тезаурус толтырудың қадамдық алгоритміне баға берген салалық аудармашылардың кәсіби біліктілігінің сапалық және сандық көрсеткіші





Аудармашының жұмыс тілдері

Лауазымы

Саны

Қазақ, орыс, ағылшын

Аудармашы, докторант

8

Қазақ, орыс, ағылшын

Аудармашы, магистрант

17

Қазақ, орыс, ағылшын

Аудармашы, ф.ғ.к., PhD

5

Қазақ, орыс

Аудармашы, мемлекеттік органдар мамандары

3

Қазақ, орыс және шетел тілі (француз, неміс, араб, қытай, корей, т.б.)

Аудармашы, магистр

6

Ескерту – Автор құрастырған

Барлық саны 39 аударма саласындағы кәсіби мамандар Digital Library платформасында Zthes деректер схемасында әзірленген салалық терминдердің көптілді басқарылмалы тезаурусын құрастырудың қадамдық алгоритмін ақпараттық технология мамандарының жетістіктерін аудармашыларға түсінікті тілмен түсіндірілгенін растады.


Сонымен қазақ тіліндегі тау‑кен терминдерін біріздендіру мен жүйелеудің бірден бір жолы – Digital Library платформасы арқылы электрондық тезаурус құрастыру деп білеміз. Салалық аударма үшін құрастырылып жатқан тезаурустың басты артықшылығы таргеттік немесе релеванттық іздеуде. Қазақ тілінің тау‑кен терминдері республикамыздағы Терминологиялық комитет бекіткен терминологиялық қорға жинақталған (Termincom.kz) [269], алайда ғылым мен техниканың, әсіресе тау‑кен саласының қарқынды дамуымен байланысты салалық аудармашылар қызметінде күн сайын жаңа терминдер кездесуде.
Тау‑кен терминдерінің тезаурусын құрастыру кезінде біраз қиыншылықтардың кездескенін де жасырмаймыз. Бұл қиыншылықтарға алдымен зерттеудің пәнаралық сала екендігін жатқызамыз. Терминдердің көптілді тезаурусын құрастыру тіл білімінің терминология саласының да, аударматанудың да, компьютерлік лингвистика мен ақпараттық технологиялардың да зерттеу нысанына жатады. Сондықтан қазіргі таңдағы тезауруспен айналысатын аудармашылардың алдында үлкен талап тұр. Аудармашығы мынадай талаптар қойылады:

  • салалық аудармадағы пән саласының көптілді құзыретті маманы болуы;

  • терминологиядағы терминжасам принциптерін білуі;

  • ақпараттық технологиялардағы тезаурус құрастырудың нақты қадамдарын, алгоритмін және нұсқаулықтарын меңгеруі.

Қазақстандағы салалық терминологияны зерттеуші ғалым профессор Ж. Бейсенова кәсіби аудармашыларды даярлаудағы салалық терминдердің маңызын айырықша атап өтіп, жоғарғы оқу орындарының академиялық бағдарламаларына «Кәсіби аударма және терминология» пәнін енгізген болатын (2006). Салалық терминдерді орыс, француз, неміс тілдерінде қарастырған Г. Бейсембаева «Кәсіби коммуникация саласындағы аудармашы» даярлаудың қажеттілігін көрсетті [198].
Цифрландыру жағдайының қарыштап дамуына дейінгі 2015-2016 жылдарға дейін жасалған электрондық сөздіктер қолданыстан тыс қала бастады. Аталған мәселелерді шешу жолында салалық аудармаға қажетті тың шешімдердің бірі басқарылмалы тезаурус құрастыру болып табылады.
Диссертациялық жұмыс аясында салалық терминдерді зерттеу пәнаралық сипатқа ие және ерекше ғылыми маңызы бар, себебі салалық терминологияны сапалы тың жаңа деңгейде зерделеуге мүмкіндік береді. Зерттеу жұмысында гуманитарлық, жаратылыстану, ақпараттық жүйелер мамандарының ғылыми ынтымақтастықтары теориялық және қолданбалы мәселелерді шешудің маңызды шарты болып табылады.
Осылайша зерттеу нәтижелерін Қазақстан Республикасының жоғары оқу орындарындағы оқу процесінде қолданумен қатар қазақстандық зерттеушілердің жас буынын (аудармашылар, тіл мамандары, терминологтар және сала мамандарын) ғылыми ізденіске белсенді тарту мүмкіндігі туып отыр.
Тау-кен және металлургия өнеркәсібі 2020 жылғы жаңа кәсіптер мен мамандықтар атласында ерекше орын алады [74-76]. Дегенмен қазіргі таңда Қазақстан Республикасының аумағында осы бағытта ешбір зерттеулер жүргізілмеген. Тау-кен өндірісі терминдеріне синхронды талдау әлі жүйелі түрде жүргізілмеген, ұсынылған жоба тақырыбы бойынша басқарылмалы электрондық көптілді тезаурус бұрын соңды жасалмаған.
Тау-кен терминологиясын зерттеу нәтижелері қазақ тілінің ғылыми стилінің функцияларын нығайтады және кеңейтеді, мемлекеттік тілдің мәртебесін жаңа деңгейге көтереді. Бұл зерттеу тау-кен терминологиясын дамытуға, қазақ тілінің ғылыми стилі функцияларын кеңейтуге, қазақ тілінің корпусын құруға және әлемдегі қазақ тілінің функцияларын сақтауға теориялық және практикалық үлесін қосады. Зерттеу тек тау-кен өнеркәсібінде ғана емес, сондай‑ақ қазақ тілінің басқа да пәндік бағыттарында, қазақ тілінің корпусын одан әрі дамыта отырып, терминологияны зерттеудің жаңа мүмкіндіктерін ашады.
Тау-кен өнеркәсібінің терминдері бұрын‑соңды пәнаралық тұрғыдан қарастырылмағандықтан, аударма теориясы мен практикасында, терминологияда, компьютерлік және корпус лингвистикасында, ақпараттық жүйелер салаларында пәнаралық бағытта зерттелген жұмыс оң нәтиже береді деп сенеміз.
Тау-кен терминдерінің басқарылмалы интероперабельді тезаурусын құрастыру терминологиялық базаны басқа да салалық терминдермен ұдайы толықтыруға, қазақ тілінің корпусын жасауға және барлық мүдделі тұлғаларға қолжетімді болуына мүмкіндік береді.
Зерттеу нәтижелері веб-платформада тау-кен өндірісі терминдерінің түрлі терминжүйелеріндегі бағыттар бойынша жүйеленді (геология, металлургия, минералогия және т.б.). Бұл әлеуетті пайдаланушыларға ғаламтор желісінде ақпаратты іздеу (Information Retrieval) мен компьютерлік бағдарламалар көмегімен тіларалық аударма кезінде қазақ, ағылшын және орыс тілдеріндегі семантикалық дұрыс балама алуға мүмкіндік береді. Зерттеу нәтижелері тау-кен өндірісінде көптілді тезаурустың зияткерлік іздеу жүйесінің деректерін тиімді пайдалануға мүмкіндік береді. Бұл ұлттық компанияларға, министрліктерге және пән мамандарына мобильді болумен қатар ғаламтордағы көптеген мәселелер бойынша қажетті ақпаратты тез табу мүмкіндігін береді.
Тезаурустарды жеке пән салаларында қолданудың анықталған артықшылықтары мен шектеулерін ескере отырып, оларды құрастыру және қазіргі заманғы аудармашыларды даярлауда қолдану процесін жақсарту үшін мынадай шараларды ұсынамыз.

  1. Ақпараттық технологияларды қолдануға баса назар аудара отырып, отандық жоғары оқу орындарының Аударма ісі мамандықтарында салалық терминдер тезаурустарын құрастыру және оларды оқу процесінде қолдану әдістемесін құру бойынша жұмысты күшейту.

  2. Ақпаратты іздеуді (Information Retrieval) жеделдету мақсатына бағытталған қазақша-орысша-ағылшынша басқарылмалы тезаурусы ISO 25964-1:2011 (бірінші бөлім) және ISO 25964-1:2013 (екінші бөлім) сияқты соңғы халықаралық ISO стандарттарына сәйкес жасалуы керек. Бұл тезаурустың интеоперабельдігін көрсетеді. Халықаралық сапа стандарттарына сәйкес тезаурустарды құрастыру оларды осы стандарттарға сәйкес құрастырылған басқа халықаралық тезаурустармен біріктіруге, шетелдік әріптестер жасаған жұмысты өзара тиімді пайдалануға мүмкіндік береді. Мысалы, қазақ тілінің мазмұны қамтылмаған халықаралық ЮНЕСКО тезаурусы, Tilde Terminology және WordNet тезаурустарымен өзара интероперабельді қатынасы арқылы қазақ тілінің қолданыс аясы кеңейеді.

  3. Салалық терминдер тезаурустарын оқу процесінде кеңінен қолдану қажет. Ол үшін студенттерге және тәжірибеші аудармашыларға тегін қол жетімділікті қамтамасыз ету қажет. Басқарылмалы тезаурустардың ыңғайлы интерфейсі болуы өте маңызды.

Басқарылмалы интероперабельді тезаурустарды құрастыру әдістемесін жасау және оларды аудармашыларды даярлауда қолдану маңызды. Осы саладағы серпіліске қол жеткізу үшін әртүрлі салалық көптілді тезаурустарды құрастыру мен практикада қолданудың орындылығын, оларды аймақтағы көршілес елдер үшін локализациялау мүмкіндігін, отандық мамандардың қолданыстағы әзірлемелерін жоспарлау мен пайдалануды сауатты талдау қажет. Мұның бәрі жақын және алыс шетелдердің мамандарымен және терминологиялық базалардың құқық иелерімен белсенді халықаралық серіктестікті қажет етеді.
Қазақстан Республикасы үшін үштілді салалық тезаурустарды дамытудың экономикалық тиімділігіне оларды терминологиялық базаны дұрыс пайдалану мақсатында қазақ, ағылшын, орыс тілдеріндегі салалық ауызша және жазбаша аудармашылары мен кез келген сала мамандарының, сондай-ақ компьютерлік лингвистерді даярлаудың нақты мәселелерін шешуге пайдаланған кезде ғана қол жеткізуге болады деп сенеміз. Мұндай тезаурус түрінің ең басты ерекшелігі аударма жадысына ену мүмкіндігінің болуында (TM‑Translation memory).
Мемлекеттік органдар мен компаниялардың басқарылмалы тезаурустарды қолдануы ақпарат іздеу (Information Retrieval) кезінде тиімді әрі релевантты ақпаратты табуына және берілген тақырып аясында дұрыс семантикалық баламаларды таңдауына мүмкіндік береді. Қазақстандық үштілді тезаурусты құрастыру бойынша жұмыстар графалар немесе нейрондық желілерге негізделген жартылай автоматты және толық автоматтандырылған генерациясына арналған инновациялық технологияларды енгізуді жеделдете алады. Зерттеу нәтижелері ҚР министрліктерінде, тау-кен компанияларында, аналитикалық және кеңес беру орталықтарында белсенді түрде енгізіле бастады (Қосымша Ғ).
Зерттеу нәтижелері ғылыми және білім беру қызметі үшін маңызды. Жұмыс нәтижелері білікті және бәсекеге қабілетті кадрларды даярлау мақсатында компьютерлік лингвистиканы, аударма теориясы мен практикасын, түркологияны, терминологияны эмпирика және интеграция тәсілдері арқылы оқытуда ұдайы теориялық және практикалық қолданыста болады. Диссертация жұмысының нәтижесінде Л.Н. Гумилев атындағы Еуразия ұлттық университетінің Аударма теориясы мен практикасы кафедрасы салалық терминологияның көптілді басқарылмалы тезаурусын құрастыру әдістемесі бойынша семинарлар мен үздіксіз білім беру курстары арқылы тарататын үйлестіруші әдістемелік орталық бола алады. Зерттеу нәтижелері Аударма ісі, Филология, Шетел филологиясы, Шетел тілдері, Түркітану, Қолданбалы тіл білімі, Ақпараттық жүйелер мамандықтары бойынша студенттерге ғылыми және оқу процесіне белсенді енгізілетін болады.
Зерттеу нәтижелері диссертация жұмысының практикалық нәтижесі болып табылатын Zthes деректер схемасы негізінде жасалған Digital Library веб-платформасы арқылы әлеуетті пайдаланушыларға, студенттер мен магистранттарға, ғалымдар қауымдастыққа және көпшілікке қол жетімді болады.
Пәнаралық зерттеудің нәтижелері әр түрлі ғалымдар мен мамандар қауымдастығына қазақ тілінің ұлттық ғылыми корпусын құрудың бірыңғай тұжырымдамасын жасауға мүмкіндік береді.
Еліміздегі көптілділікті қолдау саясатымен және Қазақстанға көптеп тартылатын шетелдік инвестицияларға байланысты терминология саласы тау-кен ісінің жаңа терминдерімен толықтырылуда. «Цифрлық Қазақстан» бағдарламасы аясында геологиялық деректер базасының және инфрақұрылымның сапасын арттыру үшін «Минералды ресурстардың ұлттық деректер банкі» құрылып жатқандығы [270], барлық тарихи және геологиялық деректерді біріктіретін және оларды заманауи форматта ұсынатын жүйе, мемлекеттік органдар және жер қойнауын пайдаланушылар қызметінің айқындылығын, инвестициялар кірісін арттыратын, инвесторларға ұсынылатын ақпараттың шынайылығын қамтамасыз ету мақсатында барлық салалық ақпарат қазақ, орыс және ағылшын тілдерінде берілуі шарт. Осы орайда үштілді, салалық аудармашыларға сұраныс одан әрі өсуде.
Салалық аударманың пән саласы терминологиясы, аударматану мен компьютерлік лингвистика тоғысында «Цифрлық Қазақстан» мемлекеттік бағдарламасының міндеттерін жүзеге асыру мақсатында қолданылатын инновациялық технологиялар аудармашылардың алдында жаңа деңгейге өту талабын қоюда. Цифрландыру кезеңінде қазіргі заман талабына сай сөздіктердің инновациялық жаңа «буынын» құрастыру қажеттілігі туғаны баршамызға мәлім. Мұндай сөздіктерге тіл мамандарының ақпараттық технологиялар мен пән салалары мамандарымен бірлесіп жасаған белгілі пән салалары бойынша көптілді басқарылмалы интероперабельді тезаурустар жататынын осы жұмысымызда дәлелдедік. Пән салаларындағы тезаурустар салалық терминдердің дәл семантикалық аудармасын жылдам табу мақсатында аудармашылар мен кәсіби мамандарға өте қажет.
Аударматануда тезаурус құрастырудың келешегі зор. Ғылым мен білімнің әр пән саласына арналған зерттеулер қазақ ғылыми тілінің мәртебесін арттырады және тілдің функционалдық қызметін нығайтады.




      1. Достарыңызбен бөлісу:
1   ...   30   31   32   33   34   35   36   37   ...   41




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет