Разработка и исследование методов создания специализированного компьютерного банка знаний для органической химии 05. 13. 11 математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей



Дата23.07.2016
өлшемі0.63 Mb.
#216607
түріАвтореферат
На правах рукописи


Рештаненко Наталья Валентиновна


РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДОВ СОЗДАНИЯ СПЕЦИАЛИЗИРОВАННОГО КОМПЬЮТЕРНОГО БАНКА ЗНАНИЙ ДЛЯ ОРГАНИЧЕСКОЙ ХИМИИ

05.13.11 – математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей




Автореферат

диссертации на соискание ученой степени

кандидата технических наук

Владивосток

2007

Работа выполнена в отделе интеллектуальных систем Института автоматики и процессов управления Дальневосточного отделения РАН.



Научный руководитель кандидат технических наук

старший научный сотрудник

Артемьева Ирина Леонидовна

Официальные оппоненты доктор технических наук, профессор

Грудин Борис Николаевич

кандидат технических наук

Лифшиц Александр Яковлевич

Ведущая организация Институт систем информатики СО РАН (Новосибирск)

Защита состоится «31» мая 2007 г. в часов на заседании диссертационного совета Д 005.007.01 в Институте автоматики и процессов управления ДВО РАН по адресу: 690041, г. Владивосток, ул. Радио, 5.

С диссертацией можно ознакомиться в библиотеке Института автоматики и процессов управления Дальневосточного отделения РАН.


Автореферат разослан « » 2007 г.


Ученый секретарь

диссертационного совета Д 005.007.01 А.В.Лебедев



Общая характеристика работы


Актуальность проблемы. К настоящему времени разработано большое число прикладных программных систем для решения задач в области химии. Ранние системы для данной области не являлись интеллектуальными, поскольку при их разработке не использовались методы искусственного интеллекта. Но после того, как такие методы получили широкое применение, появились интеллектуальные программные системы для решения задач данной области. В разработку интеллектуальных систем, решающих задачи в области химии и, в частности, в области органической химии, внесли вклад Гордеева Е.В., Зефиров Н.С., Карри Б., Випке В.Т., Хеффрон М., Либман С. и др.

Примерами программных систем, решающих задачи в области химии, в частности, в области органической химии, являются LHASA, SINGEN, EROS, AIPHOS, AOCR и др. Такие программы позволяют изучать свойства химических соединений с использованием сложного математического аппарата и моделей, описывающих зависимости этих свойств от молекулярной структуры вещества. Базы данных этих программ содержат большой объем справочной информации.

Одним из подходов к созданию интеллектуальных систем является их разработка на основе онтологий. Это, с одной стороны, делает понятным для специалистов интерфейс таких систем, с другой стороны, повышает доверие пользователей к ним. Онтологии также являются средством обеспечения повторного использования информации, хранимой в базах знаний интеллектуальных систем, а также методов, применяемых при решении задач.

В настоящее время разработаны онтологии некоторых фрагментов химии (например, Chemical Elements, Chemical Ontology, SUBSTANCES, Chemical-Crystals, Pure Substances, Plinius), а также онтологии некоторых близких к химии областей (например, Gene Ontology, The Sequence Ontology, TAMBIS, COMe).

Последние два десятилетия характеризуются развитием Интернет-технологий, которые востребованы и в области химии. Уже создано большое число сайтов, содержащих химическую информацию, а также порталов, хранящих такую информацию из области органической химии, как структура органических соединений, их физико-химические свойства, способы синтеза и применения. Сайты и порталы предоставляют возможность хранения, редактирования и просмотра имеющейся информации специалистами областей.

Однако практика показывает, что прикладные системы (в том числе в области химии), быстро устаревают, и даже использование интеллектуальных систем, основанных на знаниях, не решает эту проблему. Ее решение возможно лишь в том случае, когда интеллектуальная система обеспечивает коллективное развитие баз знаний, основана на общепринятой онтологии, а средства развития ее баз знаний доступны через сеть Интернет. Однако в настоящее время нет интеллектуальных Интернет систем, предоставляющих не только возможности коллективного развития баз знаний и их просмотра пользователями, но и использования их для компьютерной обработки программными системами.

Ни одна из разработанных за рубежом интеллектуальных систем для решения задач в области химии не основана на онтологиях. Существует лишь две интеллектуальные системы, разработанные на основе онтологии – система решения вычислительных задач физической химии и система определения состава соединений с использованием рентгено-флуоресцентного метода анализа, созданные в нашей стране.

Во многих из разработанных за рубежом онтологий определены классы по­нятий и их иерархии, а знания задаются как элементы классов и часто не отде­ляются от самой онтологии. Такое представление затрудняет использование он­тологий и знаний при создании интеллектуальных систем, поскольку в онтоло­гии сложной реальной предметной области, особенно области, связанной с нау­кой, между терминами онтологий существуют отношения, отличные от иерархи­ческих отношений между классами понятий, а знания области постоянно обнов­ляются. В настоящее время существуют лишь две онтологии для химии, опреде­ляющие такие отношения. Это онтология физической химии и онтология рент­гено-флуоресцентного анализа, созданные в нашей стране. Онтология же орга­нической химии до сих пор не разработана.

Таким образом, актуальной является разработка интеллектуальной Интер­нет-системы, основанной на онтологии органической химии, предоставляющей возможность создания и коллективного развития баз знаний, а также их исполь­зования при решении прикладных задач. Кроме того, система должна учитывать наличие пользователей разной квалификации в данной предметной области.

Целью диссертационной работы является разработка моделей, методов и средств создания интеллектуальной Интернет-системы для коллективного развития баз знаний в области органической химии и использования их при решении задач программными системами.

Так как предметная область органической химии весьма обширна и сложна, то развитие баз знаний в ней может осуществляться в нескольких направлениях. Все эти направления предполагают наличие общего ядра, которое должно со­держать терминологию и знания университетского курса органической химии. Развитие баз знаний влечет появление новых классов прикладных задач. По­этому Интернет система должна поддерживать механизмы для добавления про­граммных компонент, предназначенных для решения новых прикладных задач. С учетом этих замечаний, для достижения поставленной цели в диссертацион­ной работе необходимо решить следующие задачи:



  1. Разработать концепцию расширяемой интеллектуальной Интернет сис­темы для коллективного развития баз знаний в области органической химии и использования их при решении прикладных задач (концепцию специализиро­ванного компьютерного банка знаний в области органической химии).

  2. Разработать онтологию органической химии в объеме университетского курса и ее модель.

  3. В терминах модели онтологии разработать математические постановки для решаемых в университетском курсе задач и методы их решения.

  4. Разработать методы реализации расширяемого специализиро­ванного компьютерного банка знаний в области органической химии, основан­ного на предложенной концепции.

  5. Разработать прототип расширяемого специализиро­ванного компьютерного банка знаний в области органической химии, основан­ного на предложенной концепции, содержащего редакторы онтологий и знаний, а также решатель задач определения путей синтеза органических соединений, и провести его экспериментальное исследование.

Методы исследования. Для решения указанных задач использовались элементы математической логики, теории алгоритмов и исчислений, методы построения онтологий и их математических моделей, а также методы системного программирования.

Научная новизна работы состоит в следующем.

  1. Предложена концепция специализированного компьютерного банка зна­ний в области органической химии, описывающая механизмы коллективного развития баз знаний, предназначенных как для специалистов, так и для компью­терных систем, а также механизмы для добавления программных компонент, предназначенных для решения новых классов прикладных задач.

  2. Впервые разработана модульная онтология органической химии в объ­еме вузовского курса и ее модель.

  3. Для всех классов задач поиска путей синтеза органических соединений специфицирован метод решения как вывод в исчислении, а именно определены правила построения начального состояния вывода, правила завершения вывода, а также правила формирования очередного состояния процесса вывода.

  4. Разработаны методы реализации расширяемого специализированного трехуровневого редактора метаонтологий, онтологий и знаний, позволяющего подключать специализированные графические компоненты редакторов знаний, вызов которых при редактировании управляется онтологией.

  5. Разработан метод автоматического определения схемы базы данных для представления знаний на основе определения терминов и связей между ними в онтологии.

Практическая ценность работы состоит в следующем:

  1. Реализован прототип расширяемого специализированного компьютер­ного банка знаний в области органической химии, основанный на предложенной концепции и содержащий трехуровневый редактор метаонтологий разделов, онтологий и зна­ний подразделов, графический редактор структурных формул, решатель класса задач поиска путей синтеза органических соединений, графические системы ввода исходных данных, вывода и объяснения результатов.

  2. С использованием трехуровневого редактора создано информационное наполнение спе­циализированного банка знаний по органической химии, содержащее метаонто­логию органической химии, 26 модулей онтологии и 26 модулей знаний подраз­делов органической химии.

Материалы диссертации использовались в учебном процессе на базовой кафедре программного обеспечения ЭВМ Дальневосточного государственного университета (ДВГУ) при Институте автоматики и процессов управления (ИАПУ) ДВО РАН при чтении курса лекций по дисциплине "Системы искусст­венного интеллекта", при выполнении курсовых и дипломных работ студентами кафедры программного обеспечения ЭВМ ДВГУ, а также на кафедре органической химии химического факультета Института химии и прикладной экологии ДВГУ. Результаты работы используются в научных иссле­дованиях отдела интеллектуальных систем ИАПУ ДВО РАН при разработке единого подхода к определению свойств онтологий и исследований его приме­нимости к оцениванию произвольных онтологий на практике.

Апробация работы. Основные научные и практические результаты работы докладывались и обсуждались на следующих международных и отечественных конференциях и семинарах: Дальневосточной математической школе-семинаре им. академика Е.В. Золотова (Владивосток, 2001, 2002, 2004); международной конференции «Искусственный интеллект. Интеллектуальные и многопроцессор­ные системы» (Кацивели, 2004, 2006); шестом международном симпозиуме «Ин­теллектуальные системы Intel 2004» (Москва, 2004); научной сессия МИФИ (Москва, 2006, 2007); конференции «Фундаментальные и прикладные проблемы современной физики» (Москва, 2006); II Международной конференции по ког­нитивной науке (Санкт-Петербург, 2006); совместных семинарах отдела интел­лектуальных систем ИАПУ ДВО РАН и базовой кафедры программного обеспе­чения ЭВМ ДВГУ (2002-2007).

Публикация результатов работы. По материалам диссертации опубликовано 24 печатные работы, из них 2 статьи в журналах, входящих в перечень ВАК.

Структура и объем работы. Диссертационная работа состоит из введения, пяти глав, основная часть работы машинописного текста изложена на 150 страницах, включающего 10 рисунков и 1 таблицы, заключения, списка литературы, включающего 101 наименование и 4 приложений.

СОДЕРЖАНИЕ РАБОТЫ


Глава 1 диссертации содержит обзор литературы. В ней анализируются существующие онтологии и модели онтологий различных разделов предметной области «Химия», рассматриваются средства представления онтологий и описываются существующие программные системы, решающие задачи в предметной области «Химия». Особое внимание уделяется анализу онтологий органической химии и систем, решающих задачи органической химии.

Глава 2 диссертации содержит описание концепции расширяемого специализированного компьютерного банка знаний по органической химии, основных направлений развития органической химии, задач, которые необходимо решать с использованием специализированного компьютерного банка знаний, его состав и классы пользователей.

Специализированный компьютерный банк знаний для органической химии (СКБЗ_ОХ) – это расширяемая интеллектуальная программная система для Ин­тернет, созданная для решения различных задач профессиональной деятельности этой предметной области (ПО), обеспечивающая коллективное развитие баз зна­ний (БЗ) данной области и поддерживающая механизмы для добавления новых программных компонент, предназначенных для решения новых прикладных за­дач данной области. СКБЗ_ОХ состоит из информационного (ИН) и программ­ного наполнения (ПН), а также блока администрирования.

Информационное наполнение СКБЗ_ОХ должно содержать онтологию и базу знаний органической химии. Онтология и БЗ данной ПО должны быть мо­дульными, где каждый модуль соответствует некоторому разделу области. СКБЗ_ОХ должен позволять добавление новых модулей онтологии и БЗ в ин­формационное наполнение. ИН также должно включать ссылки на теоретиче­скую информацию различных разделов ПО, представленную в книгах и публи­кациях. Другим компонентом ИН должна быть расширяемая библиотека мето­дов решения прикладных задач ПО.

П
рограммное наполнение СКБЗ_ОХ должно включать: средства редактиро­вания ИН и набор программных средств для решения прикладных задач ПО. Средства редактирования ИН должны включать специализированные редакторы онтологий и знаний, а также редактор теоретического материала. Поскольку в органической химии важное место уделяется работе со структурными форму­лами, редактор знаний должен содержать графический компонент для редакти­рования структурных формул. Редактор знаний должен позволять добавление новых компонент для редактирования знаний о других типах графических объ­ектов (например, знаний о спектрах и т.д.). Знания, введенные с помощью гра­фического компонента, должны переводиться во внутреннее представление, оп­ределяемое онтологией. Редакторы онтологий и знаний должны позволять ре­дактирование онтологических соглашений и законов ПО в виде формул при по­мощи специализированного редактора формул. Редакторы онтологий и знаний должны содержать компоненты для проверки онтологических соглашений. Про­граммное наполнение СКБЗ_ОХ должно также включать системы поиска и про­смотра содержимого ИН, а также решатели прикладных задач, среди которых должен быть решатель задач определения путей синтеза органических соединений.

Блок администрирования СКБЗ_ОХ должен администрировать пользовате­лей и контролировать жизненный цикл всего банка знаний. Пользователями СКБЗ_ОХ являются гости, инженеры знаний, эксперты и прикладные пользова­тели. Для каждого прикладного пользователя, в зависимости от того, каким ви­дом деятельности он занимается, существует ряд задач, которые он сможет ре­шать с помощью СКБЗ_ОХ. (рис.1). Эти задачи определяются полномочиями пользователя. Каждому полномочию сопоставлен компонент ПН, поддержи­вающий выполнение данного полномочия. Список полномочий и поддержи­вающих их компонент ПН должен быть расширяемым. СКБЗ_ОХ должен позво­лять пользователю получать свое автоматизированное рабочее место (АРМ), ко­торое содержит те компоненты ПН, которые требуются ему при решении задач. Редактор онтологий включаются в АРМ пользователя только в том случае, если пользователь является инженером знаний. Редактор знаний включаются в АРМ пользователя только в том случае, если пользователь является специалистом-экспертом ПО. Пользователь, который не является инженером знаний или экспертом, получает только решатели прикладных задач.

Глава 3 диссертации содержит описание модульной онтологии предметной области «Органическая химия. Вузовский курс» и ее модели, определяет ее со­став – множество модулей и связи между ними.

Структура модульной онтологии данной ПО приведена на рис. 2. Стрелочка на рисунке идет от модуля М1 к М2, если при определении модуля М2 использована терминология модуля М1. Мо­дульная модель онтологии органической химии состоит из 26 связанных между собой модулей. Онтология органической химии использует терминологию из онтологии физической химии (представленной на рис. 2 отдельным модулем). В онтологии определены 171 термин и 107 онтологических соглашений. Каждый модуль модели онтологии записан с использованием языка прикладной логики (ЯПЛ). Приведем пример модуля модели онтологии «Структурная формула со­единения», в котором определяются термины для представления структурных свойств соединений.



Структурная формула соединения(ST, Математические кванторы, Интервалы) = <({Электронная конфигурация, Функциональные группы, Углеродный скелет, Константы онтологии}), SS>, где SS предложения, описанные ниже.

Определения вспомогательных терминов



    1. типы связи º {простая, двойная, тройная}

    2. компонента º функциональные группы È {C}

    3. номера элементов º I[1, ¥)

    4. множество связей º (È (n:[1, максимальное количество связей])(´ химические элементы È компонента, номера элементов, типы связи)Ý n)

    5. возможные компоненты структурной формулы º (´ химические элементыÈ компонента, номера элементов, {}множество связей))

    6. возможные структурные формулы º {(f: {(n: I[1,¥)) возможные компоненты структурной формулыÝ n})(&(i: I[1, length(f)]) (&(j1: {(j: I[1, length(f)]) i ¹ j}) p(2, p(i, f)) ¹ p(2, p(j1, f))))}

    7. к
      омпонента структурной формулы º (l(v: {(v1: (´ возможная структурная формула, I[1, ¥))) p(2, v1) Î I[1, length(p(1, v1))]}) p(1, p(p(2, v), p(1, v))))


    8. связи элемента в компоненте структурной формулы º (l(v: {(v1: (´ возможные структурные формулы, I[1, ¥))) p(2, v1) Î I[1, length(p(1, v1))]}) p(3, p(p(2, v), p(1, v))))

    9. валентность элемента º (l(v: {(v1: (´ возможные структурные формулы, I[1, ¥))) p(2, v1) Î I[1, length(p(1, v1))]}) m(связи элемента в компоненте структурной формулы(p(1, v1), p(2, v1)) + m({(v2: связи элемента в компоненте структурной формулы(p(1, v1), p(2, v1))) p(3, v2) = двойная})) + m({(v3: связи элемента в компоненте структурной формулы(p(1, v1), p(2, v1))) p(3, v3) = тройная})*2)

    10. номер компоненты структурной формулы º (l(v: (´ возможные структурные формулы, возможная формула вещества)) {(v1: номера элементов) (& (i: I[1, length(p(1, v))]) компонента структурной формулы(p(1, v), i) Ï функциональные группы & компонента структурной формулы(p(1, v), i) = p(2, v) È компонента структурной формулы(p(1, v), i) Î функциональные группы & формула функциональной группы(компонента структурной формулы(p(1, v), i)) = p(2, v))})

    11. структурная формула º (l(v: возможная формула вещества) {(f: возможные структурные формулы) (& (i: I[1, length(f)]) p(2, p(i, f)) £ length(f)) & (& (v1: {(v2: химические элементы) принадлежит соединению(v, v2)}) (Ú (i: I[1, length(f)]) v1 = p(1, p(i, f)) & ((m ({(i: I[1, length(f)]) p(1, p(i, f))) = v1}) = индекс(v, v1))) & (&((i: I[1, length(f)]) валентность элемента(f, i)) £ max(возможная валентность элемента(компонента структурной формулы(f, i))))) & (&((i: I[1, length(f)]) связи элемента в компоненте структурной формулы(f, i) ¹ Æ))))))})

Определения основных терминов

    1. c(структурная формула соединения) = (химические вещества ® возможные структурные формулы)

    2. c(сокращенная структурная формула) = (органические соединения ® возможные структурные формулы)

    3. c(структурная формула функциональной группы) = (функциональные группы ® возможные структурные формулы)

    4. c(структурная формула углеродного скелета соединения) = (органические соединения ® возможные структурные формулы)

Онтологические соглашения

    1. (v: органические соединения) структурная формула соединения(v) Î структурная формула(формула(v))

    2. (v: органические соединения) (i: {(i1: I[1, length(структурная формула соединения(v))]) p(1, p(i1, структурная формула соединения(v))) = С}) валентность элемента(структурная формула соединения(v), i))=4

    3. (v: органические соединения) (i: I[1, length(структурная формула соединения(v))]) валентность элемента(структурная формула соединения(v), i) Î возможная валентность элемента(компонента структурной формулы(структурная формула соединения(v), i))

    4. (v: {(v1: органические соединения) тип структуры углеродного скелета соединения(v1) = цепь}) (i: {(i1: I[1, length(структурная формула углеродного скелета соединения(v))]) p(1, p(i1, структурная формула углеродного скелета соединения(v))) = С}) m({(v2: связи элемента в компоненте структурной формулы(структурная формула углеродного скелета соединения(v), i)) p(1, v2) = С}) £ 2

    5. (v: {(v1: органические соединения) тип структуры углеродного скелета соединения(v1) = цепь}) (i: {(i1: I[1, length(структурная формула углеродного скелета соединения(v))]) p(1, p(i1, структурная формула углеродного скелета соединения(v))) ¹ С}) m({(v2: связи элемента в компоненте структурной формулы(структурная формула углеродного скелета соединения(v), i)) p(1, v2) = С}) = 2

    6. (v: органические соединения) (v1: {(v2: химические элементы) принадлежит соединению(формула(v), v2)) (i: I[1, length(структурная формула углеродного скелета соединения(v))]) p(1, p(i, структурная формула углеродного скелета соединения(v))) ¹ С) Þ m({(v3: связи элемента в компоненте структурной формулы(структурная формула углеродного скелета соединения(v), i)) p(1, v3) = С}) ³ 2

    7. (v: органические соединения) (i: I[1, length(структурная формула углеродного скелета соединения(v))]) length(сокращенная структурная формула(v)) = length(структурная формула углеродного скелета соединения(v)) – m({(j1: I[1, length(сокращенная структурная формула(v))]) p(1, p(j1, сокращенная структурная формула(v))) ¹ C}) + общее число функциональных групп(v) & сокращенная структурная формула(v) = структурная формула углеродного скелета соединения(v) È (È (v1: функциональные группы соединения(v)) формула функциональной группы(v1))

Онтология и ее модель представляют явно все соглашения органической химии в объеме университетского курса. Модульная структура онтологии и ее модели обеспечивает расширяемость онтологии на случай новых подразделов данной области.

Глава 4 диссертации содержит математические постановки для всех типов задач, решаемых в университетском курсе органической химии, и описание методов их решения.

Все задачи, решаемые в университетском курсе органической химии можно разделить на четыре класса: (1) определение физико-химических свойств, (2) определение класса органических соединений, (3) задачи определения пути синтеза органического соединения и (4) задачи прогнозирования физико-химических свойств. Математическая постановка задачи формулируется в терминах модели онтологии и определяет входные и выходные параметры задачи и их связи с терминами онтологии ПО.

Существует два вида задач определения физико-химических свойств хими­ческих соединений и реакций: вычислительные задачи и задачи определения значения свойства. Вычислительные задачи являются общими как для органиче­ской, так и для физической химии. Задачи определения значения свойства пред­полагают нахождение значения (не числового) свойства органических соедине­ний или реакций и решаются методом поиска в базе знаний. Задача классифика­ции состоит в определении класса органического соединения на основе его на­звания или краткой структурной формулы. В обоих случаях метод решения за­дачи сводится к поиску по базе знаний. Если при постановке данной задана краткая структурная формула, то Class = {(i: {(i: I[1, length(Short_Structural_Formula)]) компонента структурной фор­мулы(Short_Structural_Formula, i) возможные формулы функциональных групп}) классы функциональной группы(компонента структурной фор­мулы(Short_Structural_Formula, i)}.

Существуют 12 подклассов задач определения путей синтеза органического соединения. В математической постановке задачи одним из входных параметров является синтезируемое соединение. Значения других входных параметров могут задавать условия, которым должен удовлетворять процесс синтеза. Такие условия могут определять соединения, которые могут (или должны) участвовать в процессе синтеза, соединения, которые принадлежат множеству соединений первого шага синтеза. Любое из соединений может быть задано либо своим названием, либо краткой структурной формулой. При задании условий может быть задан класс (или множество классов), которому принадлежит некоторое соединение. В работе даны математические постановки для всех классов задач в терминах модели онтологии. Методы решения всех за­дач данного класса – это методы поиска вывода в исчислении. В работе для каж­дого класса задач специфицирован метод решения как вывод в исчислении, а именно определены правила построения начального состояния вывода, правила завершения вывода, а также правила формирования очередного состояния процесса.

Примером подкласса задач данного класса является задача определения путей синтеза соединения, если задано соединение, принадлежащее множеству соединений первого шага синтеза, и соединения, которые могут принимать участие в процессе синтеза. Определим выходной параметр данной задачи (его сорт): (Process) = {(v: ( I[1,), seq химические реакции)) length((2, v)) = (1, v)-1}. Зададим связи выходного параметра с терминами онтологии органической хи­мии: (1, Process) = число шагов процесса; (v: I[1, число шагов процесса-1]) (v, (2, Process)) = реакции процесса(v). Определим входные параметры данной за­дачи, если задано Name_Compound - название органического соединения, которое требуется синтезировать, FirstSub - соединение, принадлежащее множеству соединений первого шага, а также множество SubsCould органических соединений, которые могут принимать участие в процессе синтеза. Cвязи входных параметров с терминами онтологии органической химии задают следующие условия:

(С.1) Name Compound  вещества процесса(число шагов процесса)

(С.2) FirstSub вещества процесса(1)

(С.3) (v: I[2, число шагов процесса-1]) (v1: I[2, число шагов процесса-1]\{v}) дополнительные вещества(v)  дополнительные вещества(v1) = 

(С.4) вещества процесса(1)  органические соединения    (вещества процесса(1)  органические соединения)  SubsCould

(С.5) (v: I[2, число шагов процесса-1]) дополнительные вещества(v)  органические соединения  SubsCould

(С.6) (v: I[2, число шагов процесса-1]) дополнительные вещества(v)  вещества процесса(1) = 

Приведем пример спецификации вывода для данной задачи, представленной с использованием ЯПЛ.

/({(v: химические реакции) органические соединения реагенты(v)  SubsCould & FirstSub  реагенты(v) & Name_Compound  результаты(v)}    число шагов процесса = 2 & реакции процесса(1)  {(v: химические реакции) Name_Compound  результаты(v) & FirstSub  реагенты(v) & органические соединения реагенты(v)  SubsCould}),

({(v: химические реакции) органические соединения реагенты(v)  SubsCould & FirstSub  реагенты(v) & Name_Compound  результаты(v)} =  

М.1) число шагов процесса > 2 &

М.2) реакции процесса(1)  {(v: химические реакции) FirstSub  реагенты(v) & органические соединенияреагенты(v)  SubsCould} &

М.3) реакции процесса(число шагов процесса-1)  {(v: химические реакции) Name_Compound  результаты(v)} &

М.4) (v1: I[2, число шагов процесса-2]) реакции процесса(v1)  {(v: химические реакции) реагенты(v)  результаты(реакции процесса(v1-1))  дополнительные вещества(v1) & (реагенты(v)  органические соединения)  SubsCould}

Дадим комментарий к спецификации.

Если существует такая реакция, что First Sub принадлежит множеству ее реагентов, среди ее реагентов есть органические соединения, принадлежащие множеству SubsCould, а множеству ее результатов принадлежит соединение Name_Compound, то число шагов химического процесса равно двум, а данная реакция будет реакцией первого шага процесса. Если такой реакции нет, то требуемый процесс синтеза обладает следующими свойствами: (М.1) число шагов процесса больше двух; (М.2) реакцией первого шага является такая реакция, при которой First Sub принадлежит множеству ее реагентов и среди органических соединений - ее реагентов есть соединения из множества SubsCould; (М.3) реакцией предпоследнего шага является реакция, множеству результатов которой принадлежит соединение Name_Compound; (М.4) реакцией каждого шага с номером, начиная со второго, и до номера, равного разности числа шагов процесса и 2, является реакция, множество реагентов которой является подмножеством результатов реакции предыдущего шага и дополнительных соединений данного шага, причем все органические соединения – реагенты реакции являются элементами множества SubsCould. В данном случае условие на начальное состояние процесса вывода в исчислении задает свойство М.2, условие окончания вывода – свойство М.3, а правило работы исчисления – свойство М.4.

Время поиска пути синтеза соединения увеличивается при увеличении размера базы знаний. Для уменьшения времени поиска учитывается информация о классах соединений по вхождению функциональной группы и классах реакций. Каждый класс соединений – это множество веществ. Описание класса реакций определяет классы реагентов и результатов реакций этого класса. При поиске путей синтеза просматриваются не все реакции, а лишь те, в которых участвуют вещества требуемых классов.

В
работе даны математические постановки для задач классов (2) – (4) и для всех классов задач разработаны методы решения. Математические постановки вычислительных задач и методы их решения были ранее определены для физической химии. Задачи определения значений свойств ввиду очевидности постановок и методов не рассмотрены.



Глава 5 диссертации содержит описание методов реализации расширяемого специализированного компьютерного банка знаний по органической химии, состава его прототипа, а также результатов экспериментального исследования прототипа.

СКБЗ_ОХ состоит из следующих подсистем: административная система банка, система поддержки работы сопровождающего программиста и пользовательская часть СБКЗ_ОЗ. Функции административной системы СКБЗ_ОХ выполняет административная система многоцелевого банка знаний, разработанного в ИАПУ ДВО РАН. Поддержка работы сопровождающего программиста выполняется средствами СУБД. Сопровождающий программист имеет возможность добавлять новые полномочия пользователя, новые компоненты ПН банка и сопоставлять полномочиям эти компоненты. Сопровождающий программист также может сопоставлять типам значений терминов онтологии специализированные графические редакторы, предназначеннные для задания значений этих типов.

Архитектура пользовательской части СКБЗ_ОХ представлена на рис. 3. Пользовательская часть СКБЗ_ОХ состоит из двух частей: серверной и клиентской. Серверная часть содержит информационное наполнение, редакторы ИН, решатели прикладных задач и библиотеку методов решения задач. Клиентская часть содержит интерфейсы редакторов ИН и решателей задач. Пользователь СКБЗ_ОХ работает со своей версией клиентской части СКБЗ_ОХ – своим АРМом, который формируется в соответстсвии с полномочиями пользователя, определяемыми при его регистрации в СКБЗ_ОХ.

Развитие онтологий и баз знаний органической химии обеспечивается на­личием трехуровневого редактора метаонтологий разделов ПО, онтологий разделов и модулей знаний. Создание и редактиро­вание метаонтологии раздела управляется метаонтологией химии. Пользователь только отвечает на вопросы редактора. Редактор метаонтологии раздела автома­тически формирует некоторые термины создаваемой метаонтологии и предос­тавляет пользователю возможность их редактирования. Такая схема редактиро­вания обеспечивает создание метаонтологии раздела, для которой выполнены онтологические соглашения, задаваемые метаонтологией химии.

С помощью редактора онтологии пользователь может добавлять новый модуль онтологии раздела. С помощью редактора знаний он может вносить информацию о значениях терминов этого модуля. Если требуется внесение информации о структурных формулах, то используется специализированный графический редактор (компонент редактора знаний, который позволяет вносить эту информацию в привычном пользователю графическом виде. Вызов графического редактора управляется онтологией: если в онтологии указано, что значением некоторого термина является структурная формула, то происходит автоматический вызов графического редактора. Введенная пользователем информация о структурной формуле автоматически преобразуется в структурное описание в соответствии с описанием этой структуры в модели онтологии. Графический редактор при задании структурной формулы проверяет все онтологические соглашения, определенные в модуле «Структурная формула соединения» (и во всех используемых им), не позволяя пользователю задать не согласованные с онтологией значения.

Метаонтология раздела, онтологии и базы знаний подразделов хранятся в системе средствами СУБД. Структура базы данных для представления метаонтологии раздела фиксирована метаонтологией химии. При создании новой метаонтологии нового раздела автоматически генерируется новая база данных (ее название совпадает с именем раздела) и в нее заносится информация, задаваемая инженером знаний.

Структура представления онтологии подраздела (модуля онтологии) в базе данных также фиксирована метаонтологией химии. При создании нового модуля автоматически генерируется новая база данных (ее название совпадает с именем модуля) и в нее заносится информация, задаваемая инженером знаний или экспертом при создании модуля онтологии. При задании термина модуля онтологии пользователь должен указать термин метаонтологии, который используется при определении данного термина онтологии. Это позволяет не требовать от пользователя редактора онтологии указания информации о типах аргументов терминов-функций. Пользователь только задает область значений определяемого термина.

Структура представления информации в модуле базы знаний фиксируется модулем онтологии. Средствами СУБД автоматически создается база данных, состоящая из связанных между собой таблиц. Связи между таблицами модуля базы знаний и таблицами других модулей формируются автоматически в соответствии с описанием терминов и их связей в онтологии.

Р
азработан метод автоматического определения схемы базы данных для представления знаний на основе определения терминов и связей между ними в онтологии. Если термин в модели онтологии определен как множество, то он представлен в виде таблицы, содержащей два поля: код каждого элемента множества (ключевое поле) и значение элемента множества (рис. 4). Если термин определен как функция, то ему соответствует таблица, число полей которой на единицу (кодовое ключевое поле) больше суммы числа аргументов функции и числа элементов в представлении результата (если результат есть элемент декартова произведения, то каждому элементу этого произведения соответствует свое поле). Если термин определен как предикат, то он рассматривается как функция, возвращающая логическое значение. Типы значений в каждом поле определяются ограничениями на значения, задаваемыми модулем онтологии. Если какое-либо из значений поля является значением из множества, обозначенного каким-либо из терминов онтологии, то автоматически формируется связь между таблицами.

В прототипе в качестве такой СУБД использована СУБД Microsoft Access. Пользовательская часть прототипа содержит трехуровневый редактор метаонтологий, онтологий и знаний, а также решатель всех подклассов задач поиска путей синтеза органических соединений. С помощью трехуровневого редактора в ИН СКБЗ_ОХ была занесена метаонтология органической химии, онтологии 26 подразделов, а также знания этих подразделов.

При создании решателя задач определения пути синтеза соединения использованы спецификации вывода, описанные в главе 4. Определение пути синтеза осуществляется с помощью рекурсивной процедуры, использующей подпрограммы, соответствующие условиям, определенным спецификациями.

Исходные данные задачи задаются с использованием системы ввода исходных данных, которая при вводе исходных данных автоматически проверяет все накладываемые онтологией онтологические соглашения. При задании сокращенной структурной формулы соединения, которое требуется синтезировать, используется графический редактор структурных формул. При задании условий на путь синтеза вызываются соответствующие окна системы ввода исходных данных, где пользователь может задать требуемую информацию.

Результат решения задачи и его объяснение выдается пользователю в графическом виде. При решении задачи формируется несколько путей синтеза. Каждый путь синтеза представляется последовательностью веществ, участвующих в синтезе на каждом шаге. В объяснении приводится список реакций, имевших место на каждом шаге синтеза. Каждое вещество представляется своей краткой структурной формулой, а каждая реакция записывается с помощью принятых в предметной области графических обозначений.

Экспериментальное исследование прототипа проводилось на кафедре органической химии химического факультета института химии и прикладной экологии ДВГУ. В ходе экспериментального исследования была подтверждена гипотеза о необходимости коллективного развития базы знаний и положения концепции о направлениях дальнейшего расширения банка знаний.


Основные результаты работы


  1. Предложена концепция расширяемого специализированного компьютерного банка знаний в области органической химии, описывающая механизмы кол­лективного развития баз знаний, предназначенных как для специалистов, так и для компьютерных систем, а также механизмы для добавления программ­ных компонент, предназначенных для решения новых классов прикладных задач.

  2. Разработана модульная онтология органической химии и ее модель, описывающие основные понятия органической химии, используемые в ву­зовском курсе обучения; онтология содержит 26 модулей, определяет 171 термин и 107 онтологиче­ских соглашений.

  3. В терминах онтологии разработаны математические постановки для всех клас­сов задач, решаемых в университетском курсе органической химии, и разработаны методы их решения. Для всех подклассов задач поиска путей син­теза органических соединений специфицирован метод решения как вывод в исчислении, а именно определены правила построения начального состояния вывода, правила завершения вывода, а также правила формирования очеред­ного состояния процесса.

  4. Разработаны методы реализации расширяемого специализированного трех­уровневого редактора метаонтологий, онтологий и знаний, позволяющего подключать специализированные графические компоненты редакторов зна­ний, вызов которых при редактировании управляется онтологией.

  5. Разработан метод автоматического определения схемы базы данных для представления знаний на основе определения терминов и связей между ними в онтологии.

  6. Разработан метод реализации расширяемого специализированного компьютерного банка знаний для органической химии, основанного на концепции.

  7. Реализован прототип расширяемого специализированного компьютерного банка знаний в области органической химии, основанный на предложенной концепции и содержащий расширяемый специализированный трехуровне­вый редактор метаонтологий разделов, онтологий и знаний подразделов, графический редактор структурных формул, решатель класса задач поиска путей синтеза органических соединений, графические системы ввода исходных данных, вывода и объяснения результатов.

  8. С использованием трехуровневого редактора создано информационное наполнение специали­зированного банка знаний по органической химии, содержащее ме­таонтологию органической химии, 26 модулей онтологии и 26 модулей зна­ний подразделов органической химии.

  9. Проведено экспериментальное исследование прототипа, в ходе которого была подтверждена гипотеза о необходимости коллективного развития базы знаний и положения концепции о направлениях дальнейшего расширения банка знаний.

Опубликованные работы по теме диссертации


  1. Артемьева И.Л., Высоцкий В.И., Рештаненко Н.В. Модель онтологии пред­метной области (на примере органической химии) // Научно-техническая информация. – Сер.2. – 2005. – № 8. – С. 19-27.

  2. Артемьева И.Л., Высоцкий В.И., Рештаненко Н.В. Описание структур­ного строения органических соединений в модели онтологии органической хи­мии // Научно-техническая информация. – Сер.2. – 2006. – № 2. – С. 11-19.

  3. Артемьева И.Л., Высоцкий В.И., Рештаненко Н.В. Модульная модель онто­логии органической химии. Свойства органических соединений // Инфор­матика и системы управления. – 2006. – № 1. – С. 121-132.

  4. Артемьева И.Л., Высоцкий В.И., Рештаненко Н.В. Модель онтологии пред­метной области «Органическая химия». Органические соединения: струк­турная формула, классификация по расположению атомов углерода, типы связи между химическими элементами, пространственное расположение, изомерия / Препринт. – Владивосток: ИАПУ ДВО РАН, 2003. 24 с.

  5. Артемьева И.Л., Высоцкий В.И., Рештаненко Н.В. Модель онтологии пред­метной области «Органическая химия». Химический процесс / Препринт. – Владивосток: ИАПУ ДВО РАН, 2003. 16 с.

  6. Артемьева И.Л., Высоцкий В.И., Рештаненко Н.В. Модель онтологии пред­метной области «Органическая химия». Органические реакции: классифи­кация реакционных центров, радикалы, ионы, основные свойства реакций / Препринт. – Владивосток: ИАПУ ДВО РАН, 2003. 24 с.

  7. Артемьева И.Л., Высоцкий В.И., Рештаненко Н.В. Модель онтологии пред­метной области «Органическая химия». Органические соединения: функ­циональные группы, элементный состав, тип гибридизации, агрегатное состоя­ние, растворимость /Препринт.–Владивосток:ИАПУ ДВО РАН,2003. 24с.

  8. Артемьева И.Л., Высоцкий В.И., Рештаненко Н.В. Модель онтологии пред­метной области «Органическая химия». Электронное строение химических элементов / Препринт. – Владивосток: ИАПУ ДВО РАН, 2003. 20 с.

  9. Артемьева И.Л., Рештаненко Н.В. Специализированный компьютерный банк знаний предметной области «Химия» // Искусственный интеллект. – 2004. – №4. – С. 235-245.

  10. Артемьева И.Л., Рештаненко Н.В. Модель онтологии некоторых разде­лов предметной области "Органическая химия". Вузовский курс, Сб. тез. докл. Дальневосточная матем. шк.-сем. им. акад. Е.В. Золотова, 2002, Владивосток. С. 83-84.

  11. Артемьева И.Л., Рештаненко Н.В. Модульная модель онтологии орга-ни­ческой химии //Информатика и системы управления.–2004.–№ 2.– С.98-109.

  12. Артемьева И.Л., Рештаненко Н.В. Многоуровневая онтология предмет­ной области «Органическая химия», Сб.тез.докл. Второй международной кон­ференции по когнитивной науке, С-Петербург, 2006, с. 563-565.

  13. Артемьева И.Л., Рештаненко Н.В. Специализированный компьютерный банк знаний по органической химии и его разработка на основе онтологии // Искусственный интеллект. – 2006. – №4. – С. 95-106.

  14. Артемьева И.Л., Рештаненко Н.В. Спецификации задач в терминах онто­логии химии и методы их решения/ Препринт. – Владивосток: ИАПУ ДВО РАН, 2006, 36 с.

  15. Артемьева И.Л., Рештаненко Н.В. Архитектура компьютерного банка зна­ний по химии, Сб. тез. докл. Дальневосточной математической шк.-сем. им. акад. Золотова, Владивосток, 2004.

  16. Артемьева И.Л., Рештаненко Н.В. Концепция специализированного ком­пьютерного банка знаний предметной области «Химия», Сб. тр. Междуна­родной конференции «Искусственный интеллект - 2004. Интеллектуальные и многопроцессорные системы – 2004». Таганрог: ТРТУ. 2004. Т.2. С. 197-199.

  17. Артемьева И.Л., Рештаненко Н.В. Разработка программной системы предметной области «Органическая химия» на основе модели онтологии, Ин­теллектуальные системы: Труды Шестого международного симпозиума «Ин­теллектуальные системы Intel 2004», М.: Русаки, 2004. С. 123-124.

  18. Артемьева И.Л., Рештаненко Н.В. Интеллектуальная система по химии, имеющая средства адаптации к изменениям предметной области. // Научная сессия МИФИ-2006, сб. научн. тр. в 16 томах, т. 3, М.: МИФИ, с. 67-68.

  19. Артемьева И.Л., Рештаненко Н.В. Система, основанная на онтологии для решения прикладных задач химии. // Фундаментальные и прикладные про­блемы современной физики: сб. тез. докл., Москва, 2006. С. 303-304.

  20. Артемьева И.Л., Рештаненко Н.В. Разработка интеллектуальной сис­темы по органической химии на основе модели онтологии // Научная сессия МИФИ-2007, сб. научн. тр. в 17 томах, т. 3. Интеллектуальные системы и тех­нологии. М.: МИФИ. 2007.- С. 75-76. – ISBN 5-7262-0710-6.

  21. Артемьева И.Л., Рештаненко Н.В., Цветников В.А. Описание свойств ре­акций в модели онтологии химии // Информатика и системы управления. – 2006. – № 1. – С.132-143.

  22. Артемьева И.Л., Рештаненко Н.В. Разработка специализированного банка знаний по органической химии на основе онтологии Сб. тр. Междуна­родной конференции «Искусственный интеллект - 2004. Интеллектуальные и многопроцессорные системы – 2006». Таганрог: ТРТУ. 2006. Т.1. С. 72-76.

  23. Рештаненко Н.В. Программные системы для решения прикладных задач предметной области «химия» (обзор литературы) / Препринт. – Владивосток: ИАПУ ДВО РАН, 2006, 52 с.

  24. Рештаненко Н.В. Онтологии химии. Обзор литературы/ Препринт. – Вла­дивосток: ИАПУ ДВО РАН, 2006, 32 с.

Личный вклад автора. Все результаты, составляющие основное содержание диссертации, получены автором самостоятельно. В работах [1-8], [10-12], [21] автору принадлежит определение онтологии и ее модели для органической химии. В работе [14] автору принадлежат спецификации задач органической химии и методы их решения. В работах [9, 13, 15-22] автору принадлежит определение концепции специализированного компьютерного банка знаний по органической химии и методов его создания. В работах [1-8] принимал участие эксперт предметной области «Органическая химия».


Рештаненко Наталья Валентиновна
Разработка и исследование методов создания специализированного компьютерного банка знаний для органической химии

Автореферат

Подписано к печати 25.04.07 Усл. печ. л. 1 Уч.-изд. л. 0,9

Формат 60х84/16 Тираж 100 Заказ __


Издано ИАПУ ДВО РАН. Владивосток, ул. Радио, 5

Отпечатано участком оперативной печати ИАПУ ДВО РАН

Владивосток, ул. Радио, 5




Достарыңызбен бөлісу:




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет