Проблемы современной лингвистики 20 21 апреля 2015 года Санкт-Петербург 2015



Pdf көрінісі
бет110/142
Дата02.12.2022
өлшемі6.35 Mb.
#466267
1   ...   106   107   108   109   110   111   112   113   ...   142
Aktualnye problemy sovremennoy lingvistiki 201

Писарев Иван
Андреевич
Санкт-Петербургский государственный электротехнтческий университет «ЛЭТИ»
имени В.И. Ульянова (Ленина) 
РЕПРЕЗЕНТАЦИЯ ЛЕКСИКОСЕМАНТИЧЕСКИХ ПОЛЕЙ КОРПУСОВ 
ТЕКСТОВ НА ПРИМЕРЕ ПРЕДМЕТНОЙ ОБЛАСТИ «УПРАВЛЕНИЕ 
ЗНАНИЯМИ» 
В настоящее время на стыке научных направлений искусственного интеллекта
компьютерной 
лингвистики 
и 
Интернет-технологий 
проводятся 
интенсивные 
исследования в области решения проблемы формирования и использования пространств 
знаний в сети Интернет. Одним из таких направлений является представление знаний на 
основе онтологий [1]. Онтологии находят все большее применение в системах обучения 
студентов на основе технологий электронного обучения (E−learning). 
Процесс создания онтологии предметной области включает ряд определенных 
этапов:
- составление словаря терминов, которые характеризуют объекты и процессы, 
составляющие рассматриваемую область;
- формирование системы дефиниций терминов; 
- формальное описание логических взаимосвязей между терминами.
Для формирования словаря терминов при создании онтологии применен метод 
анализа лексико-семантических полей. Ввиду того, что в лексико−семантическом поле 
представлена «совокупность языковых (главным образом лексических) единиц, 
объединенных общностью содержания (иногда также общностью формальных 
показателей) и отражающих понятийное, предметное сходство обозначаемых явлений» 
[2], такое представление интегрирует основные понятия изучаемой области знанийв 
единое семантическое пространство. Ю.Д. Апресян описывает семантическое поле как 


Current issues of linguistics 
166 
обширное объединение слов, принадлежащих к разным частям речи и имеющих хотя бы 
один общий семантический компонент [3].
Для составления списков терминов предметной области применены средства 
автоматической обработки программного комплекса «ОнтоМАСТЕР - Онтология» к 
корпусу текстов на русском и английском языках, относящихся к предметной области 
«Управление знаниями» [4]. При анализе отношений между элементами семантического 
поля использовалась база данных WordNet [5]. 
В результате автоматической обработки получены частотные словари, из которых
затем были удалены незначимые для предметной области слова. 
Получены следующие результаты. В семантическом поле «онтология (ontology)» к 
наиболее часто употребляемым в корпусах текстов относятся концепты: знание 
(knowledge), онтология (ontology), класс (class), система (system), семантика (semantic), 
язык (language), отношение (relation) и др. 
Для визуального отображения наиболее часто употребляемых концептов применены 
«облака тегов» для корпусов текстов на русском и английском языках.
Возможно применение данного метода и к другим областям знаний. 
Литература 
1. Хорошевский В.Ф. Пространства знаний в сети Интернет и Semantic Web. Искусственный 
интеллект и принятие решений. 1/2008, C.80-97 
2. Лингвистический энциклопедический словарь. - М.: Советская энциклопедия. 1990. − 688 с. 
3. Апресян Ю.Д. Лексическая семантика. Синонимические средства языка. М.: Наука, 1974. С. 251-
252. 
4. Онтологии и тезаурусы: модели, инструменты, приложения: учебное пособие / Б.В. Добров, В.В. 
Иванов, Н.В. Лукашевич, В.Д. Соловьев. – М.: Интернет-Университет Информационных Технологий
БИНОМ. Лаборатория знаний, 2009. – 173 с. 
5. George A. Miller (1995). WordNet: A Lexical Database for English. Communications of the ACM Vol. 
38, No. 11: 39-41. 


Достарыңызбен бөлісу:
1   ...   106   107   108   109   110   111   112   113   ...   142




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет