УДК 004.82
ВИЗУАЛЬНЫЙ ЯЗЫК КЛАССИФИКАТОРОВ И ПРОЕКЦИЙ ДЛЯ РАЗРАБОТКИ БАЗ ЗНАНИЙ
Д.В. Кудрявцев (dmitry.ku@gmail.com)
Санкт-Петербургский Государственный Политехнический Университет, Санкт-Петербург
Л.Ю. Григорьев (griglev@gmail.com)
Бизнес Инжиниринг Групп, Санкт-Петербург
В работе предлагается язык визуального проектирования и наполнения онтологий для разработки баз знаний. Также в статье приводится схема соответствия предложенного языка элементам языка OWL, иллюстрируется программная реализация языка в системе ОРГ-Мастер, а также описываются результаты внедрения системы в бизнесе и органах государственной власти.
Введение
В настоящее время одним из основных компонентов баз знаний являются онтологии [Гаврилова, 2001; Davis et al, 2003]. Для представления онтологий в базах знаний используются специальные языки: RDFS [Brickley Guha, 2004], OWL [Dean, Schreiber, 2004], Gellish [Van Renssen, 2005], CycL [CycL, 2002]. Указанные языки эффективны для решения задач автоматизированной интеграции информации, обмена (interchange) знаниями и выполнения логического вывода (reasoning). Однако для работы разработчика и пользователя базы знаний требуется визуальное представление онтологий, которое может быть реализовано как с помощью специальных визуальных языков (IDEF5 и др.), так и с помощью методов визуализации онтологий, представленных в стандартных машиночитаемых языках [Katifori et al, 2007].
Проблема существующих визуальных методов представления онтологий заключается в том, что основной акцент в них сделан на задаче проектирования онтологии, а важность формата представления знаний для наполнения онтологии экземплярами недооценивается и отдается на откуп разработчикам редакторов онтологий и баз знаний. В результате этого при разработке масштабных баз знаний (более 1000 элементов) в существующих инструментах возникают сложности при наполнение онтологий.
В статье предлагается язык классификаторов и проекций для визуальной разработки баз знаний на основе онтологий, в котором в явном виде задается формат для визуальной работы с экземплярами онтологии.
1. Обзор визуальных методов представления онтологий
В работе [Гаврилова, Гулякина, 2008] был представлен комплексный обзор визуальных методов работы со знаниями, в котором онтологии были указаны в качестве одного из способов визуального структурирования знаний. Для визуального представления онтологий могут использоваться специальные визуальные языки, а также методы визуализации онтологий, представленных в стандартных машиночитаемых языках.
1.1. Визуальные языки представления онтологий
В рамках методологии IDEF для построения онтологий был создан язык IDEF5 [Верников, 1999], который включает в себя 2 специальных онтологических языка: схематический язык (Schematic Language-SL) и язык доработок и уточнений (Elaboration Language-EL). SL является наглядным графическим языком, специально предназначенным для изложения компетентными специалистами в рассматриваемой области системы основных данных в форме онтологической информации. Этот язык позволяет естественным образом представлять основную информацию в начальном развитии онтологии и дополнять существующие онтологии новыми данными. EL представляет собой структурированный текстовой язык, который позволяет детально характеризовать элементы онтологии. Основная цель всех этих диаграмм - наглядно и визуально представлять основную онтологическую информацию. Хотя стандарт IDEF5 и создавался специально для графического моделирования онтологий, однако, он имеет очень мало инструментальных средств поддержки и, соответственно, существующих способов взаимодействия с другими методологиями.
Язык UML [Буч и др., 2001] используется для объектно-ориентированного моделирования при разработке информационных систем. Диаграмма классов данного языка традиционно используется для разработки и представления онтологий. Диаграмма классов определяет типы классов системы и различного рода статические связи, которые существуют между ними. На диаграммах классов изображаются также атрибуты классов, операции классов и ограничения, которые накладываются на связи между классами.
Разработчиками системы для работы с концептуальными картами (cmap.ihmc.us) предложено визуальное представление синтаксиса языка OWL c помощью шаблонов, интегрированных в редактор концептуальных карт [Hayes et al, 2005]. Данный визуальный язык представления онтологий реализован в Concept-map Ontology Environment (cmap.ihmc.us/coe/).
1.2. Обзор методов визуализации онтологий
Детальный обзор методов визуализации онтологий сделан в работе [Katifori et al, 2007], в рамках которой выделяется 6 категорий методов визуализации онтологий и рассматриваются из достоинства и недостатки:
Иерархический список (Indented List): многие инструменты визуализации онтологий, в том числе Protege, OntoEdit, Kaon и некоторые другие, предлагают в качестве основного способа визуализации представления в стиле Проводника в Windows. При этом таксономия онтологии представляется как дерево.
Узлы-связи и деревья (Node–link and Tree): методы этой категории отображают онтологию как набор соединяющихся узлов, представляющих иерархию классов в виде вертикально- или горизонтально-размещенного дерева. Пользователю обычно предоставляется возможность разворачивать и сворачивать узлы и поддеревья для управления детализацией информации. 2-х мерная реализация данного метода осуществляется в OntoViz, IzaVis, SpaceTree, 3-х мерная в OntoSphere.
Масштабируемые (Zoomable): методы данной категории отражают иерархию классов и экземпляры через визуальную вложенность объектов (диаграммы Вена, «меньшие коробочки размещаются в больших»). При выборе объекта он увеличивается в размере (zoom-in), позволяя более детально рассмотреть свои компоненты (подклассы и экземпляры). Примеры систем и соответствующих методов: Grokker, Jambalaya, CropCircles.
Заполнение пространства (Space-filling): идея данной группы методов заключается в использовании всего пространства экрана путем разделения пространства каждого узла между его потомками в зависимости от свойств узла, например, количества потомков и т.п. Примеры: TreeMaps, Information Slices.
Фокусирование+контекст (Focus + Context): данная группа техник основана на понятии искажения (distorting) графа с целью фокусировки на определенном узле и представления его контекста (окружении). Фокусный узел отображается в центре, а связанные с ним элементы располагаются вокруг него и их размер уменьшается по мере удаления от фокуса. Для увеличения какого-либо узла пользователь должен сделать его фокусным.
Примеры: Touchgraph / TGVizTab (2-х мерный), 3D Hyperbolyc Tree.
Трёхмерные информационные ландшафты (3D Information Landscapes).
По результатам обзора можно сделать заключение, что в настоящий момент отсутствует визуальный язык или метод представления онтологии, который может быть использован как на этапе разработки онтологии, так и на этапе ее наполнения, который обеспечит также машинную обработку онтологий и позволит работать с масштабными онтологиями (более 1000 элементов).
2. http://citforum.ncstu.ru/cfin/idef/idef5.shtml
[Гаврилова, 2001] Гаврилова Т.А. Использование онтологий в системах управления знаниями // Труды международного конгресса «Искусственный интеллект в XXI веке», Дивноморское, Россия, М., Физматлит, 2001. - c.21-33. [Гаврилова, Гулякина, 2008] Гаврилова Т.А., Гулякина Н.А. Визуальные методы работы со знаниями: попытка обзора // Искусственный интеллект и принятие решений. 2008. № 1. С. 15-21. [Григорьев, Кудрявцев, 2008] Григорьев Л. Ю., Кудрявцев Д. В. Автоматизированная система поддержки организационного проектирования на основе онтологий // Труды Международной конференции AIS/CAD '08, 3-10 сентября 2008 г., пос. Дивноморское, Россия. – М.: Физматлит, 2008. – С. 129-136. [Brickley Guha, 2004] Brickley, D. Guha R.V. RDF Vocabulary Description Language 1.0: RDF Schema W3C Recommendation 10 February 2004 http://www.w3.org/TR/rdf-schema/ [CycL, 2002] СycL http://www.cyc.com/cycdoc/ref/cycl-syntax.html [Davis et al, 2003] Davies J. (Editor), Fensel D. (Editor), van Harmelen F. (Editor), 2003 Towards the Semantic Web: Ontology-driven Knowledge Management, John Wiley and sons Ltd: England. [Dean, Schreiber, 2004] Dean M., Schreiber G. (eds), van Harmelen F., Hendler J., Horrocks I., McGuinness D., Patel-Schneider P., Stein L., OWL Web Ontology Language Reference. http://www.w3.org/TR/owl-ref/ Перевод: Дмитрий Щербина. OWL, язык веб-онтологий. Руководство. Рекомендация W3C 10 февраля 2004. http://sherdim.rsu.ru/pts/semantic_web/REC-owl-guide-20040210_ru.html [Hayes et al, 2005] Hayes P., Eskridge T., Saavedra R., Reichherzer T., Mehrotra M., Bobrovnikoff D. Collaborative knowledge capture in ontologies. K-CAP 2005. P. 99-106. [Katifori et al, 2007] Katifori A., Halatsis C., Lepouras G., Vassilakis C., Giannopoulou E. Ontology visualization methods - a survey. ACM Comput. Surv. 39(4): (2007). [NeOn] http://www.neon-project.org/nw/About_NeOn [Van Renssen, 2005] Van Renssen, A.. Gellish: A Generic Extensible Ontological Language. Delft University Press, 2005. http://www.gellish.net/