Баекеева айнур толыбаевна



бет32/41
Дата07.10.2022
өлшемі6.11 Mb.
#462141
1   ...   28   29   30   31   32   33   34   35   ...   41
baekeeva a t -povtor phd (s sop pis)

Лексикалық бірлік – тілде қабылданған және жеке ұғымды белгілеуге арналған лексикалық бірлік.
Дескриптор – ақпараттық сөзбен (вербалды), синонимдік немесе мағынасы жағынан кілт сөздері класының атауы болатын код арқылы берілген лексикалық бірлік. Табиғи тілдің көпмағыналы сөздеріне бірнеше дескриптор, ал бірнеше синонимдік сөздер мен ұғымдарға – бір дескриптор сәйкес келеді. Құжаттар мен ақпараттық сұраныстарды іздеу мақсатында координатты индекстеу үшін қолданылады.
Кілт сөз – бұл ақпараттық құжат мәтінінен алынған және индекстеу кезінде оның негізгі мазмұнын көрсететін тірек сөздер.
Парадигматикалық қатынастар (базистік, аналитикалық, ассоциативті) тұрақты семантикалық байланыстарды білдіреді. Мұндай қатынастар «тектік‑түрлік», «тұтас-бөлік» және т.б. ретінде танылады. Бұл лексикалық бірліктер әр пән саласы үшін тұрақты және сөздікке бекітілуі мүмкін. Мысалы, trammeling-грохочение-тасуату, crushing-дробление-ұсату, grinding-измельчение-ұнтау, flotation-флотация-флотация, filtration-фильтрация-сүзгілеу, magnetic separation-магнитная сепарация-магнитті сепарациялау терминдері мен тіркесті терминдері Enrichment-Обогащение-Кен байыту категориясына жатады. Мұны дескрипторларды белгілеудегі парадигматикалық қатынас деп атайды.
Тау‑кен терминдерінің тезаурусын құрастыруда біз әзірге нақты екі терминжүйені іріктеп алдық, олар – металлургия және минералогия. Сонымен тезаурустағы парадигматикалық қатынастардың мынадай 3 түрі бар:

  • тектік‑түрлік қатынастары арқылы;

  • бүтін мен бөлік қатынастары арқылы;

  • үлгі мен класс қатынастары арқылы.

Тектік‑түрлік қатынастары. Ақпараттық іздеу тезаурусы (Information Retrieval) белгілі бір пән саласының индекстелген, қабылданған терминдерін көрсететін құрал. Мысалы, «формалды тілдер» мен «алгоритмдік тілдер» ұғымдарының өзара тегі мен түріне қатысты байланысы тәрізді, тау‑кен терминдеріндегі металл → алтын → күміс → асыл металл → ауыр металл, т.б. терминдер бір‑бірімен тегі мен түріне байланысты қатынаста орнатылған. Бұл ақпарат осы қатынастар туралы мәлімет береді. Тезаурус парадигматикалық байланыстарды көрсету мүмкіндігіне ие. Дескрипторлар арасындағы бұл байланыс объективті және дескриптор ақпаратты іздеу тіліне тәуелді емес (сурет 12). Термин туралы бір тілдегі мәліметті іздеу кезінде басқа тілдегі ақпарат көздері автоматты түрде көрсетіледі.



Сурет 12 – Тау-кен терминдерінің тезаурусындағы тектік-түрлік қатынастар


Ескерту – Әдебиет негізінде құралған [118]




Бүтін мен бөлік қатынастары. Ақпаратты іздеу тезаурусындағы қатынастың мұндай түрі жоғары-төменгі қатынастармен салыстырғанда анағұрлым аз қолданылады: төменгі деңгейдегі дескриптор – жоғары деңгейдегі дескриптордың белгіленген компоненті. Бүтін мен бөлік қатынастары ақпаратты іздеу тезаурусында тек жоғарыдан төменге өзара әрекеттесу барысында былай қолданылады.
Тау‑кен терминдерінің арасындағы қарастырылатын қатынастардың мысалы келтірілген: Кен байыту → Кен → Кен өндіру → Металлургия → Тау‑кен ісі, т.б. (сурет 13).



Сурет 13 – Тау-кен терминдерінің тезаурусындағы бүтін мен бөлік қатынастары


Ескерту – Әдебиет негізінде құралған [118]




Ассоциативті байланыстарды анықтау. Дескрипторлар арасындағы ақпараттық іздеу тезаурустарындағы ассоциативті байланыстарды орнатудың негізгі мақсаты иерархиялық және синонимдік қатынастарды орнатқан кезде ғана қол жеткізуге болады.
Атап айтқанда, американдық стандарт ассоциативті байланыстарды орнатудың жалпы ережесі мен дескриптор терминдерінің арасындағы ассоциативті байланыстарды анықтайды, мұнда бір терминді қолдану мағыналық жағынан басқа терминмен тығыз байланысты, кей жағдайларда олардың арасында иерархиялық немесе синонимдік байланыс болмауы да мүмкін, мысалы, beneficiation → ore → metallurgy (сурет 14).



Сурет 14 – Тау-кен терминдерінің тезаурусындағы ассоциациативті байланыстар


Ескерту – Әдебиет негізінде құралған [118]


Ақпараттық жүйелерді құру кезінде ANSI/NISO Z39.50 стандартын қолдана отырып, клиент-сервер технологиясы негізінде ақпараттық ресурстарға (пакеттерге, мәліметтер базасына және т.б.) қол жеткіздік. Z39.50 стандартының хаттамасы қолдайтын Zthes деректер схемасын қолдану тезауруста әр түрлі мәліметтер базасының жеке құрылымдық айырмашылықтарын ескеретін бірыңғай интерфейске ие болу мүмкіндігін береді.


Классикалық Zthes деректер схемасы үш өрістен құралады: termNormName, termLinkID, termScopeNote. Бұл тезаурустың жалпы терминдердің бірегейлігін сақтай отырып, оларды қысқаша сипаттауға мүмкіндік береді [28, б. 14].
Жүйелік сілтемені қолдану арқылы терминдерді іздеу жүзеге асырылады. Термин іздеу иерархиялық байланыста жоғарыдан төменге, сонымен қатар төменнен жоғарыға жүзеге асады. Тезаурустағы иерархиялық байланыстар (BT – broader term, NT – narrower term) мына терминдер арқылы беріледі:

  • басты термин (MT – main term);

  • жоғарғы термин (BT – broader term);

  • еншілес термин (NT – narrower term).

Іздеу аяқталғаннан кейін таңдалған тақырыптың барлық шарттары сканерленіп, сөздік қордан ізделетін терминнің баламасы немесе мағыналық жақындығы анықталады.
Бұл байланыстар арнайы рубрикалардың көмегімен жасалады. Біз ұсынып отырған тау‑кен терминдерінің басқарылмалы тезаурусындағы рубрикацияны «Тау‑Кен Самұрық» ұлттық тау‑кен компаниясы, осы компанияның еншілес компаниялары Тау-Кен Алтын, Тау-Кен Темір, Шалкия Цинк, Silicon Mining, Масальский ГОК, Altyntau Kokshetau, Алайғыр, Спасск мыс өндіру зауыты және басқа да тау‑кен жобалары аясындағы тау‑кен саласының құжаттамаларын аударудағы тәжірибемізге сүйене отырып жасадық. Аталған тау‑кен жобалары аясында жасалған 5000-нан астам құжаттамаларды талдау нәтижесінде, барлық «Тау‑кен ісі және металлургия» саласының терминдері мынадай рубрикаларға топтастырылды (сурет 15):

  • Металдар;

  • Минералдар;

  • Геологиялық барлау;

  • Кен өндіру;

  • Құрылғылар мен технологиялар.


Сурет 15 – Тау-кен терминдерінің тезаурусы үшін құрастырылған рубрикалар схемасы

Ескерту – Автор құрастырған


Рубрикаларды қарастыру процесі жоғарғы ретті рубрикадан төменгі ретті рубрикалардың бірі таңдалғанға дейін толассыз жалғаса береді.


ISO 25964-1:2011 стандартына сәйкес құрастырылған тезаурус лексикалық бірліктердің мына түрлерін қамтиды: жеке терминдер (зат есімдер, сын есімдер, етістіктер, үстеулер), сөз тіркестері, термин тіркестері, күрделі сөздердің лексикалық‑семантикалық компоненттері, тіркесті терминдердің қысқартулары және т.б.
Дескриптордың сөздік жазбасы тезаурустың негізін қалайтын бірлігі ретінде қарастырылып, мына формула арқылы беріледі:




Достарыңызбен бөлісу:
1   ...   28   29   30   31   32   33   34   35   ...   41




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет