КОНВЕРТАЦІЯ ФОРМАТІВ ЗБЕРІГАННЯ ГРАФОВИХ БАЗ ДАНИХ І ЇЇ РОЛЬ В ОНТОЛОГІЧНОМУ ІНЖИНІРИНГУ НА ПРИКЛАДІ СИСТЕМИ СУПРОВОДЖЕННЯ РЕАБІЛІТАЦІЇ

  • Владислав Каверинський Інститут проблем матеріалознавства ім. І.М. Францевича НАН України https://orcid.org/0000-0002-6940-579X
Ключові слова: онтологія, графова база даних, конвертація форматів, OWL, RDF/XML, онтологічний інжиніринг

Анотація

Графові бази даних є зручним інструментом для представлення онтологій та інших випадків даних з природною графовою
структурою. Графові бази даних онтологічного типу були задіяні при розробці інтелектуальної інформаційно-аналітичної
системи супроводження процесів реабілітації (TISP). Зокрема, в подібній формі було представлено такі розділи як «Біла книга»,
«Гастроентерологія», «Ішемічна хвороба серця», «Курортологія», «Медичне право», «Фізична реабілітація» та ін..
Одним з найбільш поширених і універсальних форматів зберігання онтологій є OWL, зокрема у синтаксисі RDF/XML.
Проблемою є відсутність доступного і водночас потужного і зручного графічного редактору схем онтології, що працює з
подібними форматами. Створення ж складної схеми онтології, наприклад, у редакторі, вбудованому у “Protégé” є складним і
незручним процесом. Більш того, можливості побудови онто-графу у“Protégé” є суттєво обмеженими.
Зручним інструментом для візуального розроблення, перегляду і редагування онто-графів є, розроблений в Інституті
кібернетики НАН України КІТ «Поліедр», що поєднує дружній візуальний інтерфейс і широкі функціональні можливості з
простотою роботи і освоєння. Попре це, особливістю КІТ «Поліедр» є специфічний формат зберігання графів. Натомість OWL,
що є прийнятним для багатьох графових СУБД як основний чи проміжний формат зберігання і завантаження даних наразі не
підтримується у КІТ «Поліедр». Таким чином, актуальною задачею стало створення конвертеру, що переводить XML-файли з
формату КІТ «Поліедр» в OWL у синтаксисі RDF/XML, також у зворотному напрямку.
Метою досліджень було побудувати програмну систему для переведення файлів з формату зберігання онтологічного графу
КІТ «Поліедр» (“Graph Editor”) до загальноприйнятого RDF/XML синтаксису зберігання OWL-онтологій.
В результаті роботи було проведено аналіз особливостей зберігання даних онтологічних графів у форматі “Graph Editor”,
структури відповідних XML-файлів і можливості максимально повного представлення як значущої так і допоміжної (технічної)
інформації доступними засобами RDF/XML синтаксису. З іншого боку, розроблено способи представлення стандартних OWL
сутностей і конструкції засобами “Graph Editor”. Розроблена система програмного мета-представлення даних зчитаних з
відповідного XML чи OWL-файлу та реалізовано способи її серіалізації в формат OWL чи . XML-“Graph Editor”. Відповідну
програмну систему було втілено у вигляді он-лайн сервісу.
В роботі було показано, що вершини онтологічного графу, побудованого у КІТ «Поліедр» при конвертації можуть бути
приведені до стандартних OWL-сутностей – класів, властивостей або екземплярів класів (individuals). Якщо тип явно не
вказано, за замовчуванням вершини стають класами. Також можливо представлення не типізованих вершин іншими OWLтипами, враховуючі специфічні типи зв’язків (за їх наявності). Не типізовані зв’язки можуть опційно бути інтерпретованими
як «Subclass» або «Default». Особливу увагу приділено представленню даних, що містяться у вершинах і зв’язках графу. За
замовчуванням вони стають label, але, якщо вказано специфічний тип, вони можуть стати будь-яким з варіантів «анотацій»
відповідної OWL-сутності. З даних зв’язків утворюються специфічні технічні властивості (ObjectProperty), що поєднують
відповідні вершини, до них у вигляді label чи інших annotations приєднуються дані. Передбачено створення різноманітних,
як стандартних (підклас, еквівалентність та ін..), так і довільних зв’язків-посилань між вершинами онтологічного графу, якщо
такі означені у вихідному файлі. Вкладні дані представляються посиланнями через атрибути тегів, що вказують власний
ідентифікатор та ідентифікатор батьківського data-тегу. Зворотна конвертація створює вершини онто-графу відповідних типів з
класів, властивостей і екземплярів класів онтології, за виключенням технічних (за умов конвертації попередньо перетвореного
файлу), які використовуються у такому разі для відновлення структури прив’язаних даних. Теги, що містять технічну
інформацію, не перетворюються у прив’язані дані, але використовуються для ініціалізації характеристик вершин (форма, колір,
позиція тощо).
Розроблену програму для конвертації було використано при переведенні до OWL-формату онтології за «Білою книгою», з
яким працює RDFlib у складі діалогової підсистеми TISP. Також було успішно здійснено конвертацію до OWL-формату ряду
інших медичних онтологій у рамках проекту TISP. Аналіз результатів показав відсутність втрати інформації при прямій та
зворотній конвертації. Отримані успішно файли сприймаються парсерами RDF/XML формату, зокрема “Protégé”, RDFlib, Neo4j
(завантаження OWL-онтології за допомогою плагіна Neosemantics), до них можуть бути використані формальні запити на мові
SPARQL. У разі переведення отриманого OWL-файлу до Neo4j до онтології може бути застосована також мова Cypher.
В результаті роботи було створено зручний програмний інструмент для переведення онтологічних графів, створених за
допомогою зручної, наочної і потужної системи онтологічного інжинірингу КІТ «Поліедр» до OWL-онтологій у синтаксисі
RDF/XML. Це суттєво розширює практичну придатність створених у такий спосіб онтологій, дає змогу використовувати їх у
довідкових системах, системах збору і обробки інформації, з використанням стандартних засобів роботи з RDF/XML-форматом
(безпосередньо чи у якості вихідного). Можливість зворотної конвертації дає змогу застосовувати КІТ «Поліедр» для перегляду
і редагування сторонніх OWL-онтологій, набутих у мережі Інтернет або і інший спосіб.

Опубліковано
2021-12-11
Як цитувати