Аударма ісі мамандығы бойынша дайындалған диссертациялық зерттеу жұмысы пәнаралық байланыста жүргізілді. Зерттеу аясында қазақ тілінің тау-кен терминологиясын аудару мәселелері қарастырылды. Зерттеу нәтижелері негізінде, ғылыми тілдің басты қазынасы болып табылатын тау‑кен терминдерінің жаңа буын тезаурусы құрастырылды. Бұл тезауруста тау‑кен терминдері үш тілдегі баламасымен қатар, олардың түсіндірмесі, синонимдік қатары, қолданысының иерархиялық сатысы Zthes деректер схемасы негізінде жасалған арнайы веб‑платформада орналастырылды.
Digital Library веб‑платформасында тау‑кен терминдерінің терзаурусын құрастыру Л.Н. Гумилев атындағы Еуразия ұлттық университеті мен РҒА СБ Новосібір мемлекеттік университетінің Есептеу технологиялары институты арасындағы біріккен жоба аясында жүргізілді. Бұл басқарылмалы тезаурус халықаралық стандарттарға сәйкес жасалған және платформа интероперабельді. Біздің ұсынып отырған тау‑кен терминдерінің тезаурусы халықаралық мазмұнда қолданыста жүрген AGROVOC, EuroVOC, WordNet, UNESCO тезаурустарымен ортақ байланыста қызмет ете алады және ақпарат іздеу (Information Retrieval) мен машиналық аударма (MT) кезінде ақпарат алмаса алады. Тау‑кен терминдерін осы интероперабельді платформаға орналастырғандықтан, тау‑кен саласындағы ақпаратты іздеу және аудару кезінде қазақ тіліндегі мәліметті жүйелеп, әлемдік деректер базасынан тауып береді.
Зерттеу нәтижесінде тау‑кен терминологиясының үштілді басқарылмалы интероперабельді тезаурусын құрастыру арқылы төмендегідей нәтижелерге қол жеткіздік.
Қазақ тіліндегі тау-кен терминологиясының қалыптасу жолдары жан‑жақты қарастырылды. Нәтижесінде тау-кен терминологиясы алғаш рет аударматану, салалық терминология, ақпараттық технологиялар, компьютерлік лексикография және мәтінді ақпаратты өңдеу сынды пәнаралық салалар тоғысында зерттелді:
Кен өндірісі ежелгі түркі халықтарынан бастау алған. Осы себепті тау‑кен саласы терминдеріндегі негізгі металл және минерал атаулары қазақ тілінің төл терминдері қабатын құрайды. Қазақ тіліндегі тау-кен терминологиясының кен, металл, минерал атауларына қатысты қабаты жалпытүркілік сипатта берілген.
ҚР мемлекеттік терминологиялық комиссиясы бекітіп, ұсынған Терминкомдағы «Кен ісі және металлургия» саласының терминдеріне дәстүрлі тезаурустық сараптама жасадық. Нәтижесінде тау‑кен терминдерінің жалпы саны анықталды (11039), олардың ішіндегі қазақ тілінде жасалған терминдер саны – 5776 ( 52,32%), ал орыс тілі арқылы жасалған терминдер саны – 5263 (47,67%) айқындалды. Дәстүрлі тезаурустық сараптама аясында квантитативті әдісті қолдана отырып алфавиттік реті бойынша талдаудың арқасында қазақ тілінің төл дыбыстарына қатысты да дәлелдеуші ақпарат алдық.
Терминком бекіткен «Кен ісі және металлургия» саласындағы қазақ тілінің терминдеріне жасалған талдау синтетикалық тәсілге қарағанда аналитикалық тәсіл арқылы жасалған терминдер саны көбірек екендігін көрсетті. Аналитикалық тәсілмен жасалған терминдер 76,6% құрайды, әсіресе аналитикалық тәсіл тіркесті терминдерде кездеседі. Терминком бекіткен тау‑кен терминдерінде көп варианттылық пен терминдердің жарыспалығы көптеп кездеседі. Бұл мәселені шешу мақсатында осы сала терминологиясын біріздендіріп, терминдердің бірнеше нұсқасының арасында бір ғана баламасын көптілді басқарылмалы тезауруста құжаттау қажет.
Ғылым мен технологияның дамуымен байланысты қалыптасқан кен өндіру, кен байыту қызметі және құрылғы атаулары өзге тілдердің терминдерін калькалау арқылы жасалған. Сондықтан қазақ тіліндегі металл мен минерал атауларының халықаралық атауларымен немесе өзге тілден калкалау арқылы аударылған нұсқаларымен бірге, қазақ тілінің төл терминдері абсолютті синоним ретінде қолданылуы тиіс: ақық – агат (agate), лағыл – рубин (ruby), көмір тас –графит (graphite), тас тұз – галит (halite), т.б.
Тау‑кен терминдерін құрылымына, қалыптасуы мен жасалу жолдарына қарай талдау төмендегідей нәтижелерді берді.
Тау‑кен терминдері құрылымына қарай мынадай топтарға бөлінеді:
Қарапайым (түбір) терминдер: агломерация (agglomeration), ұсату (crushing), ұнтау (grinding), таужыныс (rock), т.б.
Күрделі (туынды) терминдер: домна пеші (blast furnace), ұсату машинасы (crushing machine), жоба қуаты (design capacity), т.б.
Қысқарған немесе тіркесті терминдер: ГОК, ГМК, ТЭО, ТПИ, т.б.
Тау‑кен терминдерінің қалыптасуы мен жасалу жолдарына қарай келесі топтарға жіктелді:
Төл терминдер: алтын, күміс, мыс, қорғасын, темір, қалайы, т.б.
Калькалау арқылы жасалған терминдер: агломерациялық цех, бұрғылау құрылғысы, гидрологиялық жағдайлар, домна пеші, жобалық қуат, магниттік сепарация, т.б.;
Өз кезегінде калькалану 3 топшаға бөлінеді: толық калька: mineral resources, young modulus, induction furnace, т.б.; жартылай калька: antiparticles, metacenter, ultrasound, ball mill, dry separation, magnetic survey, т.б.; аффиксті жартылай калька: jasperoid (jasperoid rock), amber placer, ellipsoid orientation, drill man, т.б.
Қысқарған терминдер: FS – Feasibility Study, ТЭН – Технико-экономикалық негіздеме; ТПИ – твердые полезные ископаемые, т.б.;
Синоним терминдер: potassium және kalium; tungsten және wolfram; жанартаулық тау жыныстары және эффузивтік тау жыныстары, вулканические породы және эффузивные породы; enrichment және beneficiation, т.б.;
Кірме терминдер: AMIRA, JORC, COGS, HSE, т.б.
Зерттеу нәтижесінде жаңадан енетін терминдерді, әсіресе қысқартылған, тіркесті және кірме терминдерді сөздіктер ресми түрде енгізіп үлгермейтініне көз жеткіздік. Салалық аудармашылар лингвистикалық эквиваленттері бекітілмеген бірқатар терминдерді сол күйі аудармасыз беріп жүр. Аударматануда шешімі табылмай жүрген аталған мәселелерді тек интеграция тәсілін қолдана отырып шеше аламыз. Оларды компьютерлік лингвистиканың, салалық терминологияның, ақпараттық жүйелердің жетістіктерінің пайдалана отырып, пәнаралық интеграция арқылы ғана жүзеге асыруға болады. Тау‑кен терминдерінің жасалу жолдары мен құрылымдық талдауында алынған нәтижелер машиналық және автоматтандырылған аудармада пайдаланылатын Lingua Parser және морфологизатор жұмысына қажет.
Салалық терминологияны тек тіл білімінің аясында ғана зерттеу оның толыққанды қолданысы мен мүмкіндігін шектейді. Салалық терминология – компьютерлік лексикографияның, арнайы пән саласының (тау‑кен ісі және металлургия) және ақпараттық жүйелердің ғылыми жетістіктерін қолдана отырып аударматанудың эмпирика (P. Newmark) және интеграция (M. Snell‑Hornby) тәсілдері арқылы да зерттеуді қажет ететін пәнаралық ғылым.
Қазақ аударматануының дамуының цифрландыру жағдайындағы қалыптасуы салалық терминология мен ақпараттық жүйелердің пәнаралық байланысының нәтижесінде жаңа кезеңге аяқ басты. Терминологияның дәстүрлі дамуы мен қалыптасуының 4 кезеңінен өтіп, аударматанудағы салалық терминологияның пәнаралық және тіларалық сипаты цифрландыру жағдайындағы өз дамуының жаңа 5-кезеңіне аяқ басқанын дәлелдедік. Бұл 2016 жылдан басталған төртінші индустриялық революция аясындағы сандық технология мен аударманың байланысынан туып отыр.
Осы кезеңдердің дәстүрлі зерттеулері нәтижелерін эмпирика және интеграция тәсілдерін қолдана отырып салалық терминдер сөздіктерінің жаңа буынын аударматанудағы мәтінді автоматты өңдеу тұрғысынан жасау қажеттілігін айқындадық. П. Ньюмарк негізін қалаған эмпирика тәсілі және М. Снелл‑Хорнби негізін қалаған интеграция тәсілі тұрғысынан аударматанудағы салалық терминология мәселелері, соның ішінде тау‑кен терминдері пәнаралық байланыста алғаш рет зерттелді.
Зерттеу барысында тау-кен терминдерінің қазақ, ағылшын және орыс тілдеріндегі аудармаларының сәйкестіктері анықталды. Осы кезге дейін кеңес дәуірінен қалыптасқан ғылыми‑техникалық аударма, техникалық аударма түрі Қазақстан аударматануында да осылай аталып келді. Ал қазіргі заман талабына сай әр пән саласының өзіндік ерекшеліктеріне байланысты аударма түрін салалық аударма деп атау дұрыс деп есептейміз. Ғылым мен техника пәндерінің ұқсас салаларының өзінде әр пән саласының термині түрліше аударылады. Мысалы, тау‑кен саласындағы ұңғыма (скважина) термині borehole деп аударылса, мұнай‑газ саласындағы ұңғыма (скважина) термині well деп аударылады. Ал тау‑кен саласындағы кен орны (месторождение) термині deposit (ore field) деп аударылса, мұнай‑газ саласындағы кен орны (месторождение) термині аудармада oil field деп беріледі.
Көптілді сөздіктердің жаңа буыны басқарылмалы интероперабельді тезаурус болып табылады. Халықаралық тезаурус құрастыру стандарттарына сәйкес жасалған жаңа буынды біртілді және көптілді басқарылмалы интероперабельді тезаурустардың ешбірінде қазақтілді контент орналастырылмаған.
Тезаурус құрастырудың теориялық және практикалық негіздері диахрондық және синхрондық жағынан зерттелді. Роже тезаурусынан бастау алған дәстүрлі және замануи, біртілді және көптілді тезаурустарға талдау жасалды. Нәтижесінде тау‑кен терминологиясының қазақ, ағылшын және орыс тілдеріндегі басқарылмалы интероперабельді тезаурусы құрастырылды. Бұл тезаурус салалық аудармадағы тау‑кен терминдерінің сапалы аударылуына тікелей әсер етеді.
Тезаурус өз ішіне терминдердің түрлері, байланыстары, топтарымен қоса тек қана энциклопедиялық, ақпараттық мәліметті беріп қана қоймай, түрлі сөздіктерді енгізе алады: анықтамалық сөздік, көптілді сөздік, синонимдер сөздігі, антонимдер сөздігі, омонимдер сөздігі, түсіндірме сөздік, идеографиялық сөздік, сөздік мақалалар, т.т. Тезауруста терминдер семантикалық және функционалдық жағынан нақты анықталып, олардың лингвистикалық баламалары бекітіліп, иерархиялық түрде жіктелді.
Тау‑кен терминдерінің қазақ, ағылшын, орыс тілдеріндегі тіларалық аудармада сипаттамасы (description), лингвистикалық эквиваленттері (LE – linguistic equivalents), синонимдері (абсолюттік синонимдері), антонимдері (бар болған жағдайда), ассоциативтік терминдері, терминдердің бір бірімен иерархиялық байланысы, яғни терминдердің жоғарғы (broader term) және еншілес (narrower term) ұғымдарын белгіледік. Тезауруста терминдер семантикалық және функционалдық жағынан нақты анықталып, олардың лингвистикалық баламалары бекітіліп, иерархиялық түрде жіктелді.
Қазақ, ағылшын және орыс тілдеріндегі тау-кен саласы терминдерінің тезаурусының рубрикациясы мен иерархиялық жіктелімі жасалды. Тезаурус құрастырудың иерархиялық жіктелімінен басқа фасеттік жіктелімнің де қолдану аясын анықтадық. «Тау‑Кен Самұрық» ұлттық тау‑кен компаниясында, оның Тау-Кен Алтын, Тау-Кен Темір, Шалкия Цинк, Silicon Mining, Масальский ГОК, Altyntau Kokshetau, Алайғыр, Спасск мыс өндіру зауыты т.б. еншілес компанияларындағы тау‑кен жобалары аясында жасалған 5000-нан астам құжаттамалар аударылған. Осы эмпирикалық материалдар негізінде тау‑кен терминдерінің басқарылмалы тезаурусындағы тау‑кен терминдерін мынадай рубрикаларға топтастырдық: металдар, минералдар, геологиялық барлау, кен өндіру және құрылғылар мен технологиялар.
Тезаурус ISO 25964-2:2013, ISO 25964-1:2011стандарттарына сәйкес құрастырылып, мынадай лексикалық бірліктердің түрлерін қамтиды: жеке терминдер, сөз тіркестері, күрделі сөздердің лексикалық семантикалық компоненттері, сөздер мен сөз тіркестерінің қысқартулары, т.б.
Zthes деректер схемасы негізінде жасалған қазақ, ағылшын, орыс тілдерінің тау‑кен терминологиясының жаңа буынды көптілді басқарылмалы интероперабельді тезаурусы Digital Library веб‑платформасында орналастырылды. Аталған платформа халықаралық тезаурус құрастырудың стандарттарына сәйкес келеді және халықаралық тезаурустармен өзара байланыс орнату мүмкіндігіне ие. Нәтижесінде қазақ тілінің тау‑кен терминдерін машиналық аударма мен мәтінді автоматты өңдеу барысында бағдарламалық жасақтамаларға қолжетімді болады. Бұл қазақ тілінің ғылыми тілінің қолданыс аясын кеңейтіп, ғылыми тіл корпусын құрудың негізі болады.
Қазақ тілінің тау‑кен терминдері – ұлттың мәдениеті, дүниетанымы, тарихы, тұрмыс‑тіршілігі, шаруашылығы туралы ақпаратты бойына жинаған тілдік бірлік болып саналады. Қазіргі терминологиялық сөздіктерде белгіленіп келген терминнің варианты емес, синонимі болып есептеледі. Кірме атаулардың синонимі немесе варианты ретінде қолданылып жүрген тау‑кен саласының қазақ тіліндегі 1500 термині ағылшын, орыс тілдеріндегі баламаларымен бірге халықаралық деректер базасына енгізілді. Тезаурус терминдердің абсолютті синонимін олардың дескрипторлары ретінде орналастыру мүмкіндігін береді.
Digital Library басқару жүйесі негізінде жасалған тезаурустың сала мамандарына беретін басты артықшылығы – ол термин іздеу барысындағы таргеттік немесе релеванттық іздеу. Салалық терминнің нақты бір саладағы семантикалық және функционалдық жағы анықталады, олардың қазақ, орыс, ағылшын тілдеріндегі лингвистикалық баламалары бекітіліп, берілген терминге қатысты барлық ақпарат тізбегіне қол жеткізе алады.
Тезаурус жүйеленген терминдер арасындағы семантикалық байланыстар мен сөздік мақалаларды көрсете алады. Тезаурусты қажетінше сөздік мақалалармен, мысалдармен, мәтіндермен толықтыру арқылы қазақ тілінің ғылыми тілінің корпусын құрастыру алғышарттары жасалды.
Көптілді тезаурус және онтологияға қатысты мәселелер аударматану ғылымына бейімделді.
Қазақ тілінің тау-кен саласындағы ұлттық сипаттағы терминдерінің жалпытүркілік сөздік қордағы орны алғаш рет тезаурус және онтология аясында анықталып, құжаттау процесі басталды.
Тау-кен терминдерінің көптілді басқарылмалы тезаурусын құрастыру тәсілдері сипатталды. Тезаурус құрастырудың қадамдық алгоритмі әзірленді. Аударматану ғылымына алғаш рет бейімделген тезаурус құрастыру әдістемесі бұл ғылым мен білімнің өзге де саласында осындай көптілді салалық тезаурус құрастырудың алғышарты болады.
Салалық аудармашыларға бейімделген тау-кен терминдерінің көптілді басқарылмалы тезаурусын құрастырудың иерархиялық алгоритмі құрастырылды, аталған модель – басқа да ғылыми пән салалары терминдерінің тезаурусын құрастырудың үлгісі бола алатыны дәлелденді. Бұл алгоритм ақпараттық жүйелер мамандарының еңбектерін пәнаралық байланыс түрғысынан зерттеу арқылы, тіл мамандарына, арнайы пән саласымен айналысатын аудармашыларға, терминолог мамандарға арналып жасалды.
ҚР Ұлттық экономика министрлігі Мемлекеттік материалдық резервтер комитетінің Персоналды басқару және құжатайналым қызметіне және ҚР Төтенше жағдайлар министрлігі Мемлекеттік материалдық резервтер комитетінің Кадр саясаты және құжатайналым басқармасына осы ғылыми‑зерттеу нәтижелерін ендіру тәжірибесі басталды. Ендіру актісі қосымшада (Қосымша Ғ) беріліп отыр.
Достарыңызбен бөлісу: |