Т=
мұнда Т – тезаурус (Тау‑кен терминдерінің көптілді басқарылмалы интероперабельді тезаурусы);
А – сала тілінің термині, сөз тіркесі немесе пән саласындағы лексикалық маңызды компоненті ретінде берілетін терминдердің символдық атауы немесе шартты түрде белгіленуі (сілтілі металл, Ca, түсті металлургия, т.б.);
В – терминнің берілген тілде мағынасын сипаттайтын терминологиялық анықтама (EN: Metallurgy is a domain of materials science and engineering that studies the physical and chemical behavior of metallic elements, their inter-metallic compounds, and their mixtures, which are called alloys);
С – енгізілген терминді білдіретін, синонимдік, омонимдік және т.б. терминдерді бөлуге арналған релятор (kz. Минерал, ru. Минерал);
D – тақырыптар жиыны немесе тезаурустың тақырыптық, рубрикалық бөлімдері (металдар, минералдар, геологиялық барлау, кен өндіру, құрылғылар мен технологиялар);
E – иерархиялық, ассоциативті қатынастар және синонимдік қатынастарды қамтитын қосарланған бинарлық байланыстар жиынтығы (Кен ісі және металлургия → Кен → Металлургия → Металл → Қорытпа → Қола).
Тезауруста терминологиялық сілтемелердің (В) болуы оларды пән салаларындағы білім көзі ретінде пайдалануға мүмкіндік береді. Тезауруста ресми ақпарат көздеріне, терминологиялық сөздіктер, энциклопедиялық дереккөздерге және басқа да сыртқы ақпарат көздеріне сілтеме жасауға болады.
Тезаурус құрамына кіретін дескрипторлардың барлық жиынтығы бірқатар талаптарға сай болуы тиіс:
тезаурус дескрипторларының жиынтығы таңдалған тақырып немее пән саласы аясындағы мәтіндердің көп бөлігін сипаттауы керек;
субъективті факторды барынша азайту үшін дескрипторларды индекстеу кезінде мағынасы жағынан жақын дескрипторларды қолдануға болмайды;
дескриптор нақты анықталған бір ғана ұғымды сипаттауы керек, яғни тау‑кен терминдерін талдаған кездегі көп варианттылыққа немесе терминдердің жарыспалығына жол бермеу керек.
Дескриптордың мазмұнын ашу үшін дескриптордың құрамына кіретін релятор қолданылады, мысалы: қола термині (қорытпа) → қола (мыс металы мен қалайы металының қосындысы) → қола термині (ағылшын тіліндегі баламасы bronze), қола термині (орыс тіліндегі баламасы бронза) → қола термині (құрамы), т.б.
ISO 25964-1:2011 стандарты ақпараттық іздеу тезаурусына бірнеше сөзден тұратын терминдерді енгізу ережелерін де қамтиды. Мұндай шешім тау‑кен терминдерінде көптеп кездесетін тіркесті терминдер мен қысқартылған терминдерді де тезаурусқа енгізуге мүмкіндік береді.
Зат есімдерден тұратын және түбір сөздер ретінде қолданылатын дескрипторлық тіркестерді енгізу тәртібіне қойылатын негізгі талаптар бар. Тіркесті терминдердің дескрипторларының семантикасы (мағынасы) оның компоненттерінен бөлек емес, олардың бірлескен мағынасымен анықталады, мысалы, blast furnace, кен байыту комбинаты, металлургиялық комбинат, т.б.
Тіркесті терминдердің кем дегенде бір компоненті басқа дескриптор тіркестерінде басқа мағынада қолданылады: ұсату, ірі ұсату, орташа ұсату, майда ұсату, ұсату цехы, ұсату бөлімшесі, ұсату машинасы, ұсату типі, т.б.
Дескрипторлардың абсолютті синонимі де болады: кен байыту → обогащение → enrichment=beneficiation.
Аскрипторлар. Тау‑кен терминдерінің ішінде баламалы қатынастардың ішкі бірнеше түрлерінің де кездесуі заңды: синонимдер, лексикалық шаблондар және квази-синонимдер. Тезаурус құрамына енетін синонимдердің негізгі түрлеріне жалпы терминдер жатады. Мысалы, болат=құрыш, саз балшық=каолин, асфальт=битум және т.б.
Лексикалық шаблондар қалыптасып кеткен қысқартулар мен аббревиатураларды білдіреді: JORC, OPEX, CAPEX, COGS және т.б.
Квази-синонимдер көбінесе аскриптор ретінде қолданылады. Квази-синонимдер дегеніміз мағынасы берілген терминге ұқсас, бірақ барлық контексте бірдей мағынада қолданылмайды. Синонимдердің бұл түрі абсолютті синоним болып табылмайды. Тау‑кен терминдерінің тезаурусын құрастырудағы басты мақсатымыз терминдердің варианттылығы мен жарыспалығын болдырмау болғандықтан, тезаурусқа квази‑синонимдерді емес, тек бір мағыналы терминдерді енгіздік.
Тезаурусты құрастырудағы маңызды аспектілердің бірі – тезаурусқа енгізетін үміткер терминдерді таңдау әдістемесі болып табылады. Бұл тезаурустың алфавиттік жүйемен берілген сөздер тізімінен ажырататын басты айырмашылығы болып саналады. Тезаурусты құрастырудағы терминдердің ішкі байланыстарын иерархиялық және фасеттік жіктелім бойынша орнатуға болады. Фасеттік жіктелім көбінесе ғылым саласының пән терминдеріне емес, белгілі бір ұғымдарды жинақтауға ыңғайлы. Мысалы, осы тезаурус құрастырудың біріккен жобасы аясында жасалып жатқан зергерлік бұйымдар атауларының тезаурусын құрастыруда фасеттік жіктелімді тиімді пайдалануға болады. Ал тау‑кен терминдерінің тезаурусы үшін иерархиялық жіктелім таңдалды.
Z39.19 деректер схемасына негізделген тау‑кен терминдерінің тезаурусындағы иерархиялық қатынастар белгілі тәртіппен орналасады. Терминнен жоғары тұратын дескрипторлар (BT) терминнен төмен тұратын (NT) мағыналық типтермен бірдей болуы керек. Олар иерархиялық жағынан жоғары немесе төменде тұрғандықтары болмаса, өзара байланысқан дескрипторлардың тегі мен түрі бірдей тұжырымдамалық категорияны белгілейді.
Ақпаратты іздеу тезаурусындағы негізгі иерархиялық қатынастар жалпы қатынастар арқылы жасалады. Сонымен терминдер арасындағы семантикалық байланыс жоғарғы және төменгі шекті қамтиды.
АҚШ стандартына сәйкес мынадай ассоциативті байланыстарды жасауға болады. Егер дескрипторлар бір иерархиялық жүйеде болған жағдайда, олардың арасында ассоциативті байланыстар мынадай шарттар арқылы жасалады. Мысалы, production және mining ұғымдары тура баламалы емес, бірақ белгілі бір контексте өзара ауыстырылып қолданыла алады. Деректер базасынан іздеу кезінде осындай ассоциативті байланыстағы сөздік мақалалар да автоматты түрде көрсетіледі.
Құжат пен терминологиялық мәліметтер арасында деректер базасы орнатылуы керек. Ғылыми пән саласы негізгі кілт терминдері арқылы рубрикацияланып, жүйеленіп, ондағы терминдердің арасындағы барлық тезаурус терминдеріне қойылатын талаптар орнатылып және топтастырылған жағдайда тезаурус терминдері өнімін береді.
Zthes схемасындағы байланыс түрі. Zthes деректер схемасына сәйкес, стандартты нұсқауларға сәйкес терминдер арасында мынадай қатынас түрлері кездеседі: ScopeNote алгоритмдік тілі мәтінді анықтау үшін қолданылатын терминнің қысқаша мәтіндік сипаттамасын қосуға және тезаурусқа стандартты терминдерді, оның бірегейлігі және метадеректерге арналған терминнің қысқаша нұсқасын қосуға мүмкіндік берді [28, б. 33].
Сонымен тезаурус құрастырудың халықаралық стандарттары мен осы саладағы практикалық тәжірибеміздің нәтижесінде сөздік мақалаларды енгізудің тезаурус құрастырудың аудармашыларға арналған, тіл мамандарына түсінікті әмбебап алгоритмін жасадық.
Достарыңызбен бөлісу: |