Баекеева айнур толыбаевна



бет24/41
Дата07.10.2022
өлшемі6.11 Mb.
#462141
1   ...   20   21   22   23   24   25   26   27   ...   41
baekeeva a t -povtor phd (s sop pis)

Роже тезаурусы (Roget’s Thesaurus of English Words) – идеографиялық сөздіктердің арасындағы ең алғашқы әрі әйгілі түрі.
AGROVOC тезаурусы – ауылшаруашылық ғылымдары мен технологиялары бойынша AGRIS халықаралық ақпараттық жүйесінің негізгі ақпараттық іздеу тілі (AGRIS – International System for Agricultural Science and Technology). Аталған тезаурусты Біріккен ұлттар ұйымының Азық-түлік және ауыл шаруашылық ұйымы мамандары жасаған [248]. AGRIS мәліметтер базасы мына салаларды қамтиды: ауылшаруашылығы, орманшаруашылығы, аквамәдениет және балық шаруашылығы, сушаруашылығы, механизация және құрылыс мәселелері, табиғи ресурстар, қоршаған ортаның ластануы, білім беру, құқық, тағамтану және адам денсаулығы, т.б.
AGCOM тезаурусы – ауылшаруашылық саласындағы байланысты құжаттандыру орталығындағы (ACDC – Agricultural Communications Documentation Center) әдебиеттер жинағындағы құжаттарды индекстеу және іздеу мақсатында қолданылады [249].
EuroVOC тезаурусы – Еуропалық Одақ құжаттарын индекстеу мақсатында пайдаланылатын ірі ақпаратты іздеу тезаурусы [250].
EuroWordNet French тезаурусы – WordNet жүйесіне негізделген еуропалық тілдерге арналған семантикалық желілер жүйесі [251]. Әр тіл өзінің жеке сөздік желісін жасайды және ол тілдер бір‑бірімен тіларалық индекс (ILI – Interlingual Index) интероперабельді жүйесі сілтемелері арқылы қабысады. Аталған тезаурустың WordNet тезаурусынан басты айырмашылығы сөздіктердің ақылы түрде болуы мен көпшілікке еркін қол жетімді болмауында.
RussNet тезаурусы – орыс тілі бойынша зияткерлік компьютерлік тезаурус [252].
РуТез тезаурусы – Ақпараттық зерттеулер орталығы жасаған автоматты индекстеуге арналған орыс тiлiнiң тезаурусы [253].
SNOMED тезаурусы – медицина саласының терминологиясы бойынша компьютерлік тезаурус [254].
WordNet тезаурусы – ағылшын тілінің лексикасы туралы ірі деректер базасы [255]. Зат есімдер, етістіктер, сын есімдер мен үстеулер когнитивтік синонимдер жиынтығына (синсеттер) топтастырылған, олардың әрқайсысы жеке ұғымды білдіреді. Синсеттер тұжырымдамалық-семантикалық және лексикалық қатынастар арқылы өзара байланысады. Нәтижесінде мағыналы байланысқан сөздер мен ұғымдар желісін браузерде іздеуге болады. WordNet тезаурусын жүктеу тегін және жалпыға қол жетімді. WordNet құрылымы компьютерлік лингвистика мен табиғи тілді өңдеу құралы ретінде пайдаланылады.
ЮНЕСКО тезаурусы – білім, мәдениет, ғылым, әлеуметтік-гуманитарлық ғылымдар, байланыс және ақпарат салаларында құжаттар мен жарияланымдарды іздеу мақсатында қолданылатын терминдердің тексерілген және жүйеленген тізімі. Тезаурус негізгі жеті пән салаларына бөлінген, ал пән салалары өз кезегінде тез танысуға мүмкіндік беретін микротезаурустарға бөлінген [244].
Аталған жаңа буынды тезаурустардың тең жартысы біртілді немесе монотілді тезаурустар қатарына жатса (RussNet, РуТез тезаурусы, SNOMED, Thesaurus.com), ал қалған жартысы көптілді тезаурустар қатарынан табылады (AGROVOC, EuroVOC, UNESCO thesaurus, РҒА СБ Digital Library). Аталған тезаурустардың ішінде тек біреуі ғана қазақ тіліндегі мазмұнмен толықтырылған (кесте 6).

Кесте 6 – Жаңа буынды электрондық тезаурустар





Тезаурус
атауы

Біртілді/ монотілді

Көптілді/ политілді

Қазақ тіліндегі контенттің болуы

1

2

3

4

AGROVOC









AGCOM









EuroVOC









EuroWordNet French









RussNet









РуТез









SNOMED









Thesaurus.com









UNESCO thesaurus









РҒА СБ Digital Library








Ескерту – Автор құрастырған

Сонымен аударма ісіндегі және аудармашыларды даярлау мақсатындағы тезаурустарды мынадай топтарға бөлуге болады:



  • білім немесе пән саласы бойынша: жалпы мақсаттағы тезаурус және салалық терминдер тезаурусы;

  • қамтылған тілдері бойынша: біртілді, қостілді және көптілді тезаурустар;

  • ақпарат тасымалдау түрлері бойынша: қағаз және электрондық тасымалдағыштағы тезаурустар.

Жалпы мақсаттағы тезаурустар жалпы түсініктер мен мағыналардың өзара байланысы мен қатынасы арқылы тілдің байлығын ашады. Мұндай тезаурустар тобы пән салаларын аудару мен өңдеуде аудармашылардың жұмысын жеңілдетеді. Жалпы мақсаттағы тезаурустың классикалық мысалы ретінде 1075 категорияға ажыратылған 330000 терминнен құрастырылған Роже тезаурусы (6 шығарылым), WordNet және EuroWordNet тезаурустарын жатқызуға болады.
Салалық терминологиялық тезаурус ұғымдардың ішкі жүйесін меңгеру арқылы белгілі бір білім пән саласындағы терминологияны тез игеруге мүмкіндік береді. Мұндай тезаурустардың басты ерекшелігі – шексіз ақпарат көзінен термин іздеуші тек қана өз пәніне қажетті ақпаратты аз уақытта тауып, тиімді есте сақтап және пайдалана алады. Тезаурусты пайдаланушы қажеттілік туған жағдайда қысқа мерзімде иерархиялық, синонимдік, ассоциативті байланыстар арқылы ұғым туралы жүйелі түсінік алып қана қоймай, ассоциативті есте сақтауды қабілетінің жұмысын арттырады.
Тезаурус құрастыруға қатысты мәселелерді зерттеу – компьютерлік лингвистика, аударматану, салалық терминология және ақпараттық технологиялар тоғысында туындаған жаңа пәнаралық зерттеу болып табылады. РҒА СБ Новосібір мемлекеттік университетінің Есептеу технологиялары институты мен Л.Н. Гумилев атындағы ЕҰУ арасындағы біріккен жоба аясында жасалған Digital Library тезаурусы қазақ тілді контент орналастыруға бағытталған. Аталған көптілді тезаурус пән саласының терминдерін ғана емес, сондай‑ақ сөздік мақалаларды да қамтитын бірегей веб-платформа болып табылады.
Тезаурус деп кез келген білім саласы туралы немесе сала пәніне қатысты сөздер, терминдер мен сөз тіркестерінің толық жүйеленген мәліметтер жиынтығын атаймыз. Тезаурус жүйеленген терминдер арасындағы семантикалық байланыстарды көрсетеді. Тезаурус өз ішіне терминдердің түрлері, байланыстары, топтарымен қоса, түрлі сөздіктерді енгізе алады: анықтамалық сөздік, көптілді сөздік, синонимдер сөздігі, антонимдер сөздігі, омонимдер сөздігі, түсіндірме сөздік, идеографиялық сөздік, т.б. Тезауруста терминдер семантикалық және функционалдық жағынан нақты анықталып, олардың лингвистикалық баламалары бекітіліп, иерархиялық жағынан жіктелген. Сонымен тезаурус – сала тілінің терминдерін жинайтын қазына.
Қостілді және көптілді тезаурус құрастыру мәселелерімен М. Фаал-Хамеданчи [256], А. Прошина [257], А. Шевцова [258] айналысқан. Отандық ғалымдардың ішінде ақпараттық жүйелер үшін көптілді электрондық тезаурус құрастыру мәселелерімен М. Самбетбаева [28], А. Нугуманова [259] айналысты. Салалық терминдер тезаурусы, соның ішінде тау‑кен терминдерінің тезаурусына қатысты зерттелген жұмыстар жоқтың қасы. Сонымен ғылыми әдебиеттерге шолу жасау салыстырмалы‑салғастырмалы түрде тау-кен терминдерінің сандық технологиялар жағдайында кешенді зерттеулердің жүргізілмегендігін айтуға мүмкіндік берді. Отандық және шетелдік пәнаралық ғылым салаларында тау‑кен терминдерінің көптілді электрондық тезаурустары құрастырылмаған.
Тезаурус құрастыру қазақ тілінің корпусын дамыту үшін мәтіндерді, метадеректерді, материалдарды ағылшын және орыс тілдеріне машиналық (MT) және автоматтандырылған (CAT) аударма үшін ең дәл семантикалық баламалары, синонимдері, ассоциативті және иерархиялық қатарлары және басқа да эмпирикалық материалдары бар қазақ тілінің салалық терминдерінің электрондық базасын жасауға ықпал етеді.
Қазіргі уақытта қолданыстағы онлайн тезаурустар техникалық жағынан интероперабельді болып келеді. Бұған жоғарыда атап өткен интероперабельді басқарылмалы тезаурустар дәлел бола алады. Аталған тезаурустар халықаралық NISO стандарттарына сәйкес жасалған және басқа сөздіктерімен өзара әрекеттесу мүмкіндігіне ие // https://www.niso.org/schemas/iso25964.
Тау-кен терминдерінің басқарылмалы интероперабельді тезаурусын құрастыру терминологиялық базаны басқа да салалық терминдермен ұдайы толықтыруға, қазақ тілінің корпусын жасауға және барлық мүдделі тұлғаларға қолжетімді болуына мүмкіндік береді. Қазақ тілінің терминологиялық базасын электрондық дерекқорларда жүйелеп, біріздендіріп және халықаралық стандарттарға сай орналастыру қазіргі таңда ҚР мемлекеттік терминологиялық комитетінің басты назарындағы мәселелерінің бірі болып табылады.


      1. Достарыңызбен бөлісу:
1   ...   20   21   22   23   24   25   26   27   ...   41




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет