Current issues of linguistics
166
обширное объединение слов, принадлежащих к разным частям речи и имеющих хотя бы
один общий семантический компонент [3].
Для составления списков терминов предметной
области применены средства
автоматической обработки программного комплекса «ОнтоМАСТЕР - Онтология» к
корпусу текстов на русском и английском языках, относящихся к предметной области
«Управление знаниями» [4]. При анализе отношений между
элементами семантического
поля использовалась база данных WordNet [5].
В результате автоматической обработки получены частотные словари, из которых
затем были удалены незначимые для предметной области слова.
Получены следующие результаты. В семантическом поле «онтология (ontology)» к
наиболее часто употребляемым в корпусах текстов относятся концепты:
знание
(knowledge), онтология (ontology), класс (class), система (system), семантика (semantic),
язык (language), отношение (relation) и др.
Для визуального отображения наиболее часто употребляемых концептов применены
«облака тегов» для корпусов текстов на русском и английском языках.
Возможно применение данного метода и к другим областям знаний.
Литература
1. Хорошевский В.Ф. Пространства знаний в сети Интернет и Semantic Web. Искусственный
интеллект и принятие решений. 1/2008, C.80-97
2. Лингвистический энциклопедический словарь. - М.: Советская энциклопедия. 1990. − 688 с.
3. Апресян Ю.Д. Лексическая семантика. Синонимические средства языка. М.: Наука, 1974. С. 251-
252.
4. Онтологии и тезаурусы: модели, инструменты, приложения: учебное пособие / Б.В. Добров, В.В.
Иванов, Н.В. Лукашевич, В.Д. Соловьев. – М.: Интернет-Университет
Информационных Технологий;
БИНОМ. Лаборатория знаний, 2009. – 173 с.
5. George A. Miller (1995). WordNet: A Lexical Database for English. Communications of the ACM Vol.
38, No. 11: 39-41.
Достарыңызбен бөлісу: