Онтологический подход к разработке системы поддержки принятия решений с использованием Информационного банка данных наукоемких технологий Республики Башкортостан
Ключевым вопросом повышения качества управления сложными системами является повышение эффективности принятия решений в проблемных ситуациях. Трудности, возникающие в процессе принятия решений, заключаются в наличии факторов неопределенности, таких как неопределенность и недостаточность знаний о значении характеристик объектов в проблемных ситуациях, о целях и о ресурсах управления, в том числе временных, и другие виды неопределенностей при определении состояния объекта; наличие проблемы выбора наиболее информативных признаков проблемных ситуаций из большого количества параметров состояния объекта, которые можно получить и проанализировать за ограниченное время; необходимость анализа значительного количества признаков проблемных ситуаций качественной природы, слабо поддающихся аналитической обработке; дефицит времени на принятие решений и значительная психологическая нагрузка на управляющий персонал.
Принятие правильных и своевременных решений должно быть поддержано предоставлением соответствующей информации, содержащей возможные альтернативы решений, выработанные в результате инструментального анализа возникшей проблемной ситуации, а также на основе знаний в области управления объекта, накопленных экспертами. Поэтому весьма актуальна поддержка принятия решений в проблемных ситуациях с использованием интеллектуальной информационно-аналитической системы, разработанной на принципах инженерии знаний в рассматриваемой предметной области. Инженерия знаний здесь определяется как совокупность методов и средств извлечения, накопления, обработки, представления и синтеза знаний. В данной работе предложен подход к применению инженерии знаний, основанный на моделировании знаний экспертов и их методов решения проблем в предметной области.
Системы поддержки принятия решений (англ. Decision Support System) представляют собой специфический класс автоматизированных информационных систем, которые поддерживают деятельность по принятию решений. Эти системы помогают специалистам выбрать и/или сформировать нужную альтернативу среди множества вариантов при принятии ответственных решений, своевременно предоставляя необходимую информацию. Таким образом, более точным наименованием системы, принадлежащей данному классу, является «Информационная система поддержки принятия решений» (ИСППР). Подобные системы относятся к классу интегрированных интеллектуальных систем, сочетающих строгие математические методы и модели поиска решения с эвристическими, логико-лингвистическими моделями и методами, базирующимися на знаниях специалистов – экспертов, моделях человеческих рассуждений и накопленном опыте. ИСППР - диалоговая система, которая обеспечивает пользователю доступ к моделям принятия решения и данным для того, чтобы поддержать слабоструктурированные и неструктурированные задачи принятия решения. В составе ИСППР средства искусственного интеллекта составляют экспертную подсистему, основанную на базе знаний и механизме логического вывода. Система обеспечивает поддержку лицу, принимающему решения, помогая в организации информации на основе базы знаний, формировании решений на основе логического вывода и обеспечивая доступ к результатам моделирования.
ИСППР должна соответствовать перечисленным ниже требованиям:
1. Информационная система поддержки принятия решений, анализируя данные о конкретной проблемной ситуации, знания и модели, должна давать актуальную и достоверную информацию, чтобы обосновать выбор альтернативы принятия решений и, кроме этого, сопровождающие пояснения пользователю.
2. В составе ИСППР должна быть база знаний о процессах управления в проблемной ситуации и база данных описания проблемных ситуаций.
3. ИСППР должна содержать средства дедуктивного логического вывода (для формирования рекомендация в реальном времени) и индуктивного вывода (на стадии интеллектуального анализа данных), а также средства, имитирующие рассуждения по аналогии, для поиска прецедентов проблемных ситуаций.
4. В составе ИСППР должны быть средства общения с удаленными пользователями, необходимые для предоставления рекомендаций и объяснения рекомендуемого решения.
5. Важной функцией ИСППР должна стать способность автоматического обнаружения противоречий между знаниями, уже имеющимися в базе знаний, и новыми, поступающими от экспертов или от программ автоматизированного извлечения знаний из данных.
6. Время формирования рекомендации ИСППР должно находиться в пределах резервного времени для данного типа сложного динамического объекта и для соответствующего класса проблемных ситуаций.
Для разработки системы поддержки принятия решений предложена методология объектно-когнитивного анализа [6].
2. Методология объектно-когнитивного анализа для разработки систем поддержки принятия решений
В пространстве знаний информационной системы поддержки принятия решений выделены следующие знания:
- семантические метазнания, представленные в предметной онтологии;
- формальные знания, представленные в виде правил продукций (база правил), на основе которых осуществляется логический вывод решения в проблемной ситуации;
- знания о прошлых проблемных ситуациях и принятых управляющих решениях (прецеденты);
- фактографические данные, получаемые в результате мониторинга состояния сложной динамической системы.
Основой интеграции указанных различных моделей представления знаний является единое информационное пространство когнитивных элементов проблемных ситуаций, сформированное в результате объектно-когнитивного анализа и моделирования процесса управления сложными системами в проблемных ситуациях.
Целью моделирования является системное описание знаний, используемых в процессе управления сложными динамическими объектами в проблемных ситуациях. В процессе исследования выявлены такие проблемы моделирования знаний, как проблема представления знаний как семантических отношений между объектами предметной области, проблема моделирования знаний о динамике поведения объектов, проблема моделирования операций и методов обработки знаний для формирования рекомендаций по принятию решений. Для решения перечисленных проблем предложена методология разработки ИСППР, основой которой является объектно-когнитивный анализ предметной области, интегрирующий методы объектно-ориентированного анализа, онтологического анализа и семантической сети представления знаний [1].
Объектно-ориентированный анализ – способ анализа, изучающий требования к системе с точки зрения будущих классов и объектов, основываясь на словаре предметной области [2].
Онтологический анализ – это уровень анализа знаний, в основе которого лежит описание предметной области в терминах сущностей, отношений между ними, и действий над сущностями [3].
Семантический анализ – это анализ предметной области, направленный на описание и идентификацию базовых элементов предметной области, установление взаимосвязей (отношений) между ними и определение характеристик отношений [4].
Разработаны следующие принципы объектно-когнитивного анализа:
- принцип иерархической декомпозиции знаний, основанный на применении различных форм абстрактного представления знаний и полиморфизме описания отношений между объектами семантической сети и полиморфизме механизмов логического вывода;
- принцип наследования свойств, основанный на отношении «класс – подкласс» в описании понятий в различных формах абстракции представления знаний;
- принцип интеграции онтологического анализа и семантического моделирования предметной области на основе иерархии понятий;
- принцип введения понятий в онтологии предметной области на базе объектно-ориентированного моделирования процесса управления в проблемных ситуациях;
- принцип осмысления понятия сходства в семантических сетях на основе кластерного анализа терминов предметной области и разработки онтологии.
Объектно-когнитивный анализ предметной области включает следующие основные этапы. Вначале, в соответствии с методологией объектно-ориентированного анализа, выделяется множество значимых сущностей из этой области (множество классов и объектов). Затем идентифицируются значимые отношения, которые существуют между классами и объектами предметной области. На следующем этапе определяется, какие операции взаимодействия объектов представляются важными, и моделируется поведение объектов. По результатам моделирования на основе онтологического анализа разрабатывается предметно-ориентированная онтология. В заключение значимые отношения оформляются синтаксически, то есть при помощи аксиом.
При моделировании ИСППР предложено использовать специальные методы и средства объектно-ориентированного моделирования предметной области, разработанные для проектирования информационных систем, чтобы воссоздать концептуальную модель экспертов в формализованной модели представления знаний. Разработаны принципы представления знаний с использованием языка объектно-ориентированного моделирования Unified Modeling Language (UML). Объектный подход содержит набор моделей, связанных с понятием класса/объекта, объединяющего данные (состояние) и поведение. На рис. 1 показана концептуальная модель ИСППР, устанавливающая отношения между вышеперечисленными компонентами представления знаний.
Комплекс моделей является основой разработки базы знаний ИСППР. Предложены методы и средства преобразования моделей в различные объектно-ориентированные нотации программирования и хранения знаний.
Таким образом, результатами объектно-когнитивного анализа являются формальные описания отношений между абстрагированными понятиями и сущностями, являющимися базовыми объектами предметной области (когнитивными элементами).
Модель семантического анализа проблемной ситуации можно представить в виде семантической сети (рис. 2), позволяющей определить цели моделирования ИСППР и сформулировать требования к результатам моделирования. Семантическая сеть – обобщенная модель предметной области, имеющая вид графа СС(A,R), в котором вершины ai-A соответствуют объектам предметной области, а дуги rj-R – отношениям между ними, A-Ǿ, R-Ǿ. В семантической сети соединено как метазнание, так и семантическое предметное знание.
Конкретизация обобщенного представления проблемной ситуации в рассматриваемой предметной области, особенно в части логических отношений, позволяет использовать логическую дедукцию для построения систем принятия решений. Обработка знаний при таком подходе базируется на использовании интерпретаторов семантических сетей, основанных на инференциальных (дедуктивных) возможностях семантических сетей и реализующих механизмы логического вывода, механизмы поиска, анализа, определения и конструирования объектов, составляющих семантическую сеть.
В семантической сети можно выделить отношения, которые особенно важны для представления и поиска знаний в системе принятия решений: логические отношения, каузальные отношения, отношения синонимии, зависимости и реализации. Эти отношения характеризуют совместимость отдельных событий или фактов в проблемной ситуации, одновременность или последовательность явлений и т.д.; они позволяют строить причинно-следственные связи, процедуры проверки целостности и непротиворечивости знаний. Для моделирования этих отношений требуются специальные модели представления интенсиональных знаний, подобные моделям, используемым в базах знаний.
Интеграция показанных выше моделей представления знания осуществляется на основе онтологического анализа. Онтологический анализ – аналитическая работа с целью определения и объединения релевантных информационно-логических и функциональных аспектов исследуемой системы в соответствующей содержательной онтологии [3]. Онтологический анализ направлен на исследование и интерпретацию системных связей в сложных предметных областях с применением методов и средств компьютерного моделирования.
Современное определение термина “онтология” в теории искусственного интеллекта неоднозначно; для практического использования наиболее подходящим является определение онтологии как знаний, формально представленных на базе концептуализации. Концептуализация предполагает описание множества объектов и понятий, знаний о них и связей между ними. Под формальной моделью MO онтологической системы [3] понимается триада вида:
M O = < O meta, {O app}, Inf F>,
где O meta – онтология верхнего уровня (метаонтология);
{O app} – множество предметных онтологий и онтологий задач предметной области;
Inf F – модель машины вывода, ассоциированной с онтологической системой M O. Сущностями метаонтологии Ontometa являются такие понятия, как «объект», «атрибут», «значение», «отношение» и т.п. Наполненная предметная онтология Ontoiapp может рассматриваться как компонента базы знаний при работе с конкретной предметной областью и являться, в свою очередь, шаблоном для построения динамической компоненты базы знаний, изменяющейся при переходе от исследования одной конкретной задачи к другой.
3. Онтологический подход к разработке системы поддержки принятия решений с использованием Информационного банка данных наукоемких технологий Республики Башкортостан
Одним из приоритетных направлений развития экономики на современном этапе является создание инновационной модели развития, обеспечивающей высокие темпы экономического роста, прогрессивные структурные сдвиги в экономике, повышение качества жизни населения. Необходимой предпосылкой для решения этой задачи является активное использование научно-технического потенциала республики, формирование структуры информационной поддержки промышленности, науки и инновационной деятельности.
В соответствии с Постановлениями Правительства Республики Башкортостан № 15 от 1 февраля 2001 года «О создании Республиканского информационного банка данных наукоемких технологий» и № 202 от 21 сентября 2005 года «О развитии Республиканского информационного банка данных наукоемких технологий» РНТИК «Баштехинформ» Академии наук РБ осуществляет разработку, формирование, наполнение и развитие информационного банка данных наукоемких технологий.
Основные задачи проекта – создание системы информационного обеспечения научно-технической деятельности, систематизация, сбор и актуализация научной информации Республики Башкортостан, содействие трансферту технологий и привлечению инвесторов, продвижение на рынок интеллектуальных ресурсов, усиление практической направленности науки академической, отраслевой и прикладной вузовской как важнейшего резерва роста производственного потенциала республики.
Web-сайт проекта расположен в сети Интернет по адресу http://www.hitec.bash.ru. Он сочетает в себе тематический каталог по разделам, связанный с научно-исследовательской и вспомогательной информацией, призванной организовать информационную поддержку инновационным проектам и исследованиям, проводимым в научных и промышленных учреждениях, а также достаточно эффективный и простой в использовании поисковый механизм, позволяющий пользователю находить необходимую информацию в базах данных.
В информационный банк данных включаются данные из открытых к опубликованию источников информации, прошедшие предварительную экспертную оценку на предмет научного уровня, значимости и новизны научно-технического решения, практической ценности. Основными категориями пользователей являются: руководители государственных органов управления (информационная поддержка управления, определение роли научных учреждений и ученых в научном процессе); ученые (доступ к актуальной научной информации, поиск партнеров и инвесторов, трансферт технологий); инвесторы и промышленность (поиск перспективных научных разработок и новых технологий, а также экспертов, способных оценить новые научные результаты и технологии и способствовать их внедрению в производство); преподаватели и студенты (знакомство с достижениями науки и техники и использование результатов научных исследований в образовательном процессе); инженеры, инженерно-технические работники и граждане (знакомство с достижениями науки и техники, перспективными разработками, доступ к информации).
В настоящее время Республиканский информационный банк данных наукоемких технологий содержит следующие базы данных: «Научно-технические решения и разработки РБ»; «Защищенные на территории РБ докторские и кандидатские диссертации»; «Авторефераты диссертаций»; «Результаты НИОКР»; «Научные и промышленные организации РБ»; «Монографии»; «Научные сборники»; «Инновационные проекты»; «НИР, ОКР, гранты»; «Эксперты по науке и технике»; «Нерешенные технологические проблемы производства»; «Промышленные образцы»; «Полезные модели»; «Международное научное сотрудничество»; «Диссертационные советы РБ»; «Программы для ЭВМ и базы данных, разработанные в РБ»; «Уникальное научное и технологическое оборудование»; «Инвесторы»; «Инфраструктура поддержки инноваций».
Знания – одна из главных ценностей научной деятельности республики. Эти знания не используются в полном объеме. Необходимо активизировать имеющиеся знания с целью порождения новых знаний. Эффективное использование накопленных за многие годы знаний несомненно повышает качество инновационной деятельности. Решение проблемы повышения качества информационных процессов подразумевает использование современных интеллектуальных технологий.
Для решения поставленной задачи предлагается разработка и внедрение интеллектуальной системы поддержки принятия решений с использованием Информационного банка данных наукоемких технологий РБ на основе методологии объектно-когнитивного анализа, интегрирующего методы и результаты объектно-ориентированного анализа, онтологического анализа и семантической сети представления знаний.
Структурирование знаний предлагается производить на основе онтологического анализа, в основе которого лежит описание предметной области в терминах сущностей, отношений между ними, и действий над сущностями. Таким образом, в процессе структуризации онтология образовательного процесса представляется в виде иерархической системы
Онтология задает единое информационное пространство, в котором интегрируются различные модели представления знания об информационном процессе, знания о конкретной области, представленное в форме онтологии Ontoedu и Ontoiapp, правила управления информационным процессом и прецеденты конкретных проблемных ситуаций, требующих принятия решений. Онтология информационного процесса включает онтологию верхнего уровня (метаонтологию) Ontometa, онтологию среднего уровня Ontoinf и предметные онтологии Ontoiapp:
Onto = < Ontometa, Ontoinf, {Ontoiapp}, InfF>,
где InfF – модель машины вывода, ассоциированной с онтологической системой Onto. Сущностями метаонтологии Ontometa являются такие понятия, как «объект», «атрибут», «значение», «отношение» и т.п. Онтология Ontoinf оперирует понятиями, характеризующими процесс поиска в базах данных (например, «изобретения», «научно-технические разработки», «инновационные проекты», «полезные модели» и др.), и организуется по образцу метаонтологии Ontometa. Предметная онтология Ontoiapp содержит понятия, характеризующие семантику особенностей информации конкретных баз данных («наименование», «область применения», «раздел науки и техники» и др.), структурированные в соответствии с иерархией, установленной для конкретной базы данных. Структура рассматриваемых предметных областей предполагает наличие в онтологии отношений наследования, статической агрегации, а также нескольких типов ассоциативных парадигматических отношений: отношений агрегации, причинно-следственных отношений, отношений сходства, отношений семантического подобия. Наполненная предметная онтология Ontoiapp может рассматриваться как компонента базы знаний при работе с конкретной предметной областью и являться, в свою очередь, шаблоном для построения динамической компоненты базы знаний, изменяющейся при переходе от исследования одной конкретной задачи к другой.
Формализация правил осуществляется на основе дескриптивной логики, а прецеденты являются экземплярами классов онтологии и представляют собой совокупность объектов. Вывод на прецедентах производится на принципах аналогии и соответствует CBR-принципам.
Повышение качества управления сложными системами будет достигнуто повышением эффективности принятия решений. Для этого предложен онтологический подход к разработке интеллектуальной системы поддержки принятия решений.
Литература:
1. Проблемы управления сложными динамическими объектами в критических ситуациях на основе знаний / Р.А.Бадамшин, Б.Г.Ильясов, Л.Р.Черняховская. – М.: Машиностроение, 2003. – 240 с.
2. Буч Г. Объектно-ориентированный анализ и проектирование с примерами приложений на С++/ Пер. с англ. – М.: «Издательство Бином», СПб.: «Невский диалект», 1998. – 560 с.
3. Базы знаний интеллектуальных систем / Т.А.Гаврилова, В.Ф.Хорошевский – СПб: Питер, 2000. – 384 с.: ил.
4. Вагин В.Н. Дедукция и обобщение в системах принятия решений. – М.: Наука, Гл. ред. физ.-мат. лит.; 1988. - 384 с.