Інформаційна технологія класифікації клінічних діагнозів на основі семантико-синтаксичної моделі
Національна академія наук України
Міністерство науки і освіти України
Міжнародний науково-навчальний центр інформаційних технологій та систем
Литвинов Олександр Анатолійович
УДК 574/578+004.38
ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ класифікації клінічнИХ діагнозів НА ОСНОВІ СЕМАНТИКО-СИНТАКСИЧНОЇ МОДЕЛІ
Спеціальність 05.13.09 – Медична та біологічна інформатика і кібернетика
Автореферат
дисертації на здобуття наукового ступеня
кандидата технічних наук
КИЇВ - 2008
Дисертацією є рукопис.
Робота виконана в Міжнародному науково-навчальному центрі інформаційних технологій та систем (Національна академія наук України і Міністерство науки і освіти України), Дніпропетровській державній медичній академії (Міністерство науки і освіти України).
Науковий керівник:
доктор медичних наук, с.н.с., Коваленко Олександр Сергійович, Міжнародний науково-навчальний центр інформаційних технологій та систем НАНУ і МОНУ, м. Київ, зав. відділом медичних інформаційних систем.
Офіційні опоненти:
доктор технічних наук, с.н.с., Файнзільберг Леонід Соломонович, Міжнародний науково-навчальний центр інформаційних технологій та систем НАНУ і МОНУ, м. Київ, провідний науковий співробітник;
кандидат фізико-математичних наук, Івлічев Володимир Петрович, Інститут кібернетики ім. В.М.Глушкова НАН України, м. Київ, провідний науковий співробітник.
Захист відбудеться “12” березня 2008 р. о 15 годині на засіданні
спеціалізованої вченої ради Д26.171.03 в Міжнародному науково-навчальному центрі інформаційних технологій та систем НАНУ і МОНУ за адресою 03680, Київ-680, МСП, просп. Акад. Глушкова, 40.
З дисертацією можна ознайомитись у бібліотеці інституту кібернетики ім. В.М. Глушкова НАН України за адресою: 03680, МПС, Київ, просп. Акад. Глушкова, 40.
Автореферат розісланий “9” лютого 2008 р.
Вчений секретар
спеціалізованої вченої ради Д26.171.03
_________________ Т.М.Гонтар
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. Сучасна тенденція розвитку госпітальних інформаційних систем (ГІС) полягає в переході від вузько-функціональних систем до багатофункціональних, комплексних і відкритих інформаційних систем; при цьому актуальним стає питання інтеграції різноманітних систем у єдиному інформаційному просторі. Ключовим моментом у цьому сенсі стають питання розробки та вдосконалення стандартів щодо надання та обміну інформацією.
Вирішення питань щодо інтеграції різноманітних госпітальних інформаційних систем, централізованої обробки, аналізу та дослідження даних, що поступають з різноманітних джерел, тісно пов’язано з вирішенням проблем стандартизації відносно надання, використання та керування біо-медичною інформацією.
При цьому у якості пріоритетних класифікацій, що використовуються в госпітальних інформаційних системах стають класифікації діагнозів, операцій, процедур, які виконують роль бази для аналітичної та статистичної оцінки лікувально-діагностичного процесу. Найважливішою серед означених слід вважати класифікацію клінічних діагнозів, яка лежить у основі і діагностичних систем, і оцінки результатів діяльності лікувальних закладів, а також є базою створення стандартів лікування.
На даний момент у більшості медичних інформаційних систем, розповсюджених на території України і в світі, як класифікація діагнозів використовується міжнародна класифікація хвороб 10-го перегляду. Однак є труднощі з її використанням в практичних і дослідницьких цілях. Так, при інформаційній обробці діагнозів не враховуються всі ознаки, властиві конкретному захворюванню. Процес адаптації інших термінологічних систем пов’язаний як зі значними витратами, так і з рядом недоліків, які роблять неефективною їх адаптацію до систем державних лікувальних закладів України.
Таким чином, дослідження всесвітнього досвіду, обґрунтування і побудова концептуальної моделі оптимальної класифікації діагнозів для лікувальних закладів України, розробка і побудова інструментарію керування цією класифікацією, враховуючи можливу інтеграцію з однією із сучасних термінологічних систем, а також її впровадження в госпітальну систему, що враховує специфіку державних лікувальних установ, є важливим завданням, пов'язаним з інформатизацією державних медичних закладів України.
Зв'язок роботи з науковими програмами, планами, темами. Напрямок досліджень співпадає з напрямком досліджень за держбюджетними науково-дослідницькими роботами на тему:
„Розробка на засадах інформаційних технологій термінів та обсягів стаціонарного лікування з невідкладної абдомінальної хірургії, інтенсивної терапії та знеболювання” (№ державної реєстрації 0199V002123, шифр роботи ІН.05.99., терміни виконання 01.1999 – 11.2003) і „Розробка термінів та обсягів стаціонарного лікування з невідкладної колоректальної хірургії, інтенсивної терапії та знеболювання” (№ державної реєстрації 0104V010390, шифр роботи ІН.07.05, терміни виконання 01.2005 – 11.2007), які здійснювались за тематичним планом проведення НДДКР у Дніпропетровській державній медичній академії.
„Розробка комплексу заходів інформаційних технологій телемедицини” (№ державної реєстрації 0107V000568, шифр роботи ВФ.135.10., терміни виконання 01.2007 – 12.2010), яка здійснюється за тематичним планом проведення НДДКР у Міжнародному науково-навчальний центрі інформаційних технологій та систем.
Мета і задачі дослідження. Метою дослідження є обґрунтування, розробка та реалізація інформаційної технології класифікації клінічних діагнозів.
Задачі дослідження. Для досягнення поставленої мети треба вирішити наступні завдання:
Провести аналіз існуючих класифікацій медичної термінології та виділити форму та вимоги до класифікації клінічних діагнозів для ефективного використання в госпітальних інформаційних системах України.
Розробити формальну модель клінічного діагнозу як основу для електронної класифікації клінічних діагнозів.
Побудувати концептуальну модель класифікації клінічних діагнозів.
Розробити та реалізувати механізми узгодження даної класифікації зі стандартними термінологічними системами.
Розробити та реалізувати комплекс програмних компонентів для ефективного використання пропонованої класифікації в інформаційних системах.
Здійснити впровадження розробленої класифікації в ГІС.
Об'єкт дослідження. Об'єктом дослідження є розробка автоматизованих термінологічних систем та їх використання у сучасних інформаційних системах.
Предмет дослідження. Предметом дослідження є інформаційна технологія класифікації клінічних діагнозів, семантико-синтаксична модель клінічного діагнозу, модель класифікації клінічних діагнозів, госпітальна інформаційна система.
Методи дослідження: Методи розробки класифікації клінічних діагнозів ґрунтуються на використанні математичних апаратів логіки предикатів, формальних граматик, фреймових систем. Методи розробки програмного забезпечення класифікації та госпітальної системи ґрунтуються на використанні: методології RUP для розробки об’єктно-орієнтованих інформаційних систем; метаінформаційного підходу при побудові підсистем статистики та аналітики госпітальної інформаційної системи; універсальної мови опису моделей (UML) для формалізації структурної та функціональної складової розроблених підсистем.
Наукова новизна отриманих результатів складається у тому, що:
вперше на основі проведеного дослідження існуючих медичних термінологічних систем визначені основні вимоги щодо їх формування, а також фактори, які впливають на їх впровадження в лікувальні заклади України;
вперше розроблено формальну модель клінічного діагнозу, яка включає семантичну та синтаксичну складові, описані з використанням формальних граматик та дескрипційної логіки;
вперше на базі сформованої формальної моделі розроблено концептуальну модель класифікації клінічних діагнозів з використанням фреймового та об’єктно-орієнтованого підходів опису знань, а також її даталогічна модель для зберігання в реляційної базі даних;
вперше розроблено механізм взаємодії зі стандартними термінологічними системами;
вперше здійснено реалізацію розробленої технології в госпітальну інформаційну систему.
удосконалено технологію проектування аналітичної підсистеми та підсистеми статистики госпітальної інформаційної системи з застосуванням метаінформаційного підходу на засадах шаблону захисту від варіацій.
Практичне значення
На засадах розробленої технології класифікації клінічних діагнозів можлива: побудова медичних класифікацій іншого напрямку (процедур, операцій); розробка стандартів медичної допомоги, які можуть використовуватися для страхової медицини.
Методика розробки модулів аналітики та статистики госпітальної інформаційної системи на базі метаінформаційного підходу дозволяє скоротити витрати, пов’язані з введенням нових стандартних та розширених звітних та аналітичних форм, здійснити адаптацію існуючої госпітальної інформаційної системи до іншого лікувального закладу.
Впровадження розроблених підсистем аналітики та статистики госпітальної інформаційної системи дає можливість більш якісного інформаційного дослідження лікувально-діагностичного процесу лікувального закладу.
Впровадження розробленої класифікації та госпітальної інформаційної системи на базі міської лікарні № 6 м. Дніпропетровська збільшило якість та швидкість формування звітності, зменшило часові витрати лікаря на формування стандартної документації.
Використання розробленої класифікації як основи програмного забезпечення для визначення обсягів гарантованої медичної допомоги на базі Дніпропетровського інституту гастроентерології АМН України дозволило комплексно вирішити задачі розрахунку фактичних витрат на лікування по конкретному хворому.
Апробація результатів дисертації. Основні результати роботи доповідалися й обговорювалися на міжнародних конференціях: “Теорія і техніка передачі, прийому і обробки інформації” (Харків 2003 р.) та “Математичне й програмне забезпечення інтелектуальних систем” (Дніпропетровськ 2004, 2005, 2006 р.).
Публікації. За матеріалами дисертації опубліковано 14 робіт, 1 монографія, 6 статей у фахових виданнях, 1 стаття в міжнародному науковому журналі, отримано 2 авторських свідоцтва на твір.
Структура і обсяг роботи. Дисертаційна робота складається з вступу, п’яті розділів, висновків, списку використаних джерел з 224 найменувань вітчизняних та іноземних авторів. Робота викладена на 165 сторінок тексту, містить 80 ілюстрацій, 29 таблиці.
Автор висловлює щиру подяку своєму науковому керівнику, д.мед.н. Коваленко О. С., завідувачу кафедри факультетської хірургії та хірургії інтернів, професору, д.мед.н. Березницькому Я. С., завідувачу кафедри ЕОМ ДНУ, професору, д.т.н. Хандецькому В. С. та безлічі інших людей без чуйної участі яких ця робота ніколи не стала би об’єктивною реальністю.
ОСНОВНИЙ ЗМІСТ РОБОТИ
У вступі обґрунтована актуальність проблеми, сформульовані мета та задачі, об’єкт, предмет та методи дослідження, надані його наукова новизна та практичне значення.
У першому розділі надається аналіз вітчизняної та зарубіжної літератури про сучасний стан в галузі ГІС і стандартів репрезентації, передачі медичних даних. Особлива увага надана аналізу сучасних термінологічних систем і питанням їх впровадження у ГІС. Розглянуті структура та основні вимоги до сучасних термінологічних систем. Показано, що на цей час не існує єдиної термінологічної системи, яка відповідала б всім цим вимогам. На території України та, взагалі, країн СНД основною термінологічною системою для кодування діагнозів є класифікація МКХ-10. З погляду оцінки розвитку та розповсюдження сучасних термінологічних систем (UMLS, GALEN, SNOMED CT), а також розглядаючи загальну тенденцію до їх інтеграції, зроблено висновок, що перехід до однієї з цих систем є неминучим; при цьому основним претендентом слід вважати SNOMED CT. Наведено основні недоліки та проблеми щодо впровадження цих систем в умовах України: великі кошти на переклад та адаптацію, складність використання та обслуговування таких систем.
Розуміючи неможливість швидкого переходу до будь-якої закордонної термінологічної системи, слід розробити модель, структуру термінологічної системи, яка буде враховувати досвід побудови попередників і також лишатися корисною при здійсненні такого переходу, враховуючи при цьому вимоги, особливості та умови вітчизняних закладів. Почати побудову такої термінологічної системи слід з предметної області діагнозів як найважливішої для пріоритетних задач аналізу лікувально-діагностичної практики та створення стандартів страхової медицини.
В другому розділі надано побудовану структурно-інформаційну модель дослідження та визначені основні етапи і задачі дослідження.
Основним методом при розробці технології класифікації клінічних діагнозів є формалізація клінічного діагнозу в рамках семантико-синтаксичної моделі відповідно визначеним вимогам до застосування в ЛПЗ України.
Визначено методику моделювання клінічного діагнозу, яка складає три рівня: 1) рівень абстрактної моделі яка об’єднує семантичну та синтаксичну складові та дозволяє віднести мову опису класифікації до формалізованих мов, визначити її переваги і недоліки, можливі шляхи розвитку і інтеграції з іншими термінологічними системами; 2) рівень фреймової репрезентації, який інтегрує дві формальні моделі, використовуючи поняття фреймів, слотів, граней та дозволяє спростити і удосконалити структурну та функціональну складові класифікації; 3) рівень концептуальної та даталогічної моделі (у контексті об’єктно-орієнтованого проектування), які визначають основні класи, їх відношення, атрибути і методи, тобто структурну і функціональну складові контуру класифікації.
Обґрунтовано застосування апарату логіки предикатів і дескрипційних логік для формалізації семантичної складової та апарату граматик Хомського для формалізації синтаксичної складової моделі клінічного діагнозу.
Для розробки і реалізації контуру класифікації та всієї госпітальної системи визначено найбільш ефективним еволюційний підхід і тісно пов’язану з ним технологію об’єктно-орієнтованого аналізу та проектування інформаційних систем. Стосовно методів розробки госпітальної інформаційної системи визначено переваги і обґрунтовано застосування метаінформаційного підходу для проектування та реалізації підсистем статистики і аналітики ГІС в рамках шаблону Protected variations.
В третьому розділі визначено вимоги до класифікації клінічних діагнозів стосовно лікувального закладу України, серед яких основними слід вважати: компактність надання множини клінічних діагнозів, базуючись на композиційній архітектурі класифікації; врахування семантичних особливостей, пов’язаних із задачею формування семантично-коректних понять; наявність механізмів формування синтаксично-правильних описів діагнозів. На базі визначених вимог та форми клінічного діагнозу надається загальна формальна модель клінічного діагнозу з використанням логіки предикатів:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
Група клінічних діагнозів які відрізняються різноманітними клінічними проявами, може бути описана у вигляді фрейму, тобто деякої структури, що описує безліч ситуацій, які можуть мати місце при формуванні діагнозу. Ядром кожного такого фрейму має бути визначена нозологія або клас захворювань, у якості якого може виступати один з елементів статистичної класифікації − міжнародної класифікації хвороб D(K) (1), і при цьому фрейм діагнозу не може бути порожнім (2). Фрейм діагнозу F(d) містить слоти клінічних характеристик Z>i> і слова-константи, що не залежать від слоту КХ С>0> (3). Слот КХ(4,5) містить у собі знаки-роздільники I>i>: I>1i>,I>2i>, змінні КХ X>i>, знаки які визначають обов'язковість, умовність і можливість наявності декількох значень даної КХ одночасно S>i>:s>1i>,s>2i>,s>3i>, слова-константи які відносяться до змінної C>x>: С>1i>,С>2i>, слова-константи C>3i> за слотом КХ, ряд вкладених слотів зі змінними P(X>i>). Вкладений слот P(X>i>) залежить від виконання відношення R(I>i>,S>i>,X>i>,С>i>) (6). Кожній змінній як основної, так і залежної клінічної характеристики, відповідає хоча б одне можливе значення даних D(X>i>) (7,8), D(X>ij>) (9). Значення основної змінної КХ D(X>i>) може бути простим x>ik> і комплексним F(X>i>) (8), а значення залежної змінної (КХ) D(X>ij>) − тільки простим x>ijm >(9). У випадку комплексного значення змінної маємо справу з фреймом другого рівня F(X>i>) (10), модель якого еквівалентна F(d). Особливістю фрейму другого рівня є виключення зон залежних КХ (11). Як дані D(X>ij>) пов'язані з клінічними характеристиками фрейма другого рівня, можуть виступати тільки прості значення x>ils >(12).
Семантикою формальної моделі є множина клінічних діагнозів, яка може бути представлена у вигляді набору формул, основаних на аксіомах, що виступають в ролі метамови і вказують на засоби та шляхи побудови цих формул. Доменом інтерпретації цих формул є скінчена кількість класів клінічних діагнозів та їх клінічних характеристик.
Наступним кроком є побудова модель синтаксичної складової класифікації яка складається з множини граматик, кожна з яких є компактним записом усіх варіантів певного діагнозу. Мета-модель, яка полягає в основі моделей (граматик) і здатна відображати як загальний процес трансформації деякої кодової комбінації в Т-термінальний ланцюжок (натурально-мовне описання клінічного діагнозу), або порядок завдання деякого діагнозу за правилами граматики, так і можливу структуру шаблону діагнозу, що задає відповідну граматику, описана правилами (13)-(25).
Кожний клінічний діагноз може бути віднесеним до одного з шаблонів, пов’язаним зі статистичним діагнозом (нозологією МКХ-10):
. (13)
Правило (14) показує структуру шаблону, яка складається з початкового термінального рядка б>i>, який може бути пустим, тобто віднесеним до множини терміналів з пустим ланцюжком, та набору слотів-атрибутів, пов’язаних з даним шаблоном:
. (14)
Правило (15) показує структуру набору слотів-атрибутів розширеного опису діагнозу, пов’язаного з кодом K>i> :
. (15)
Правило (16) показує синтаксичну структуру слота, де l>1>,l>2> – термінальні символи, які визначають границі слоту, Р>ij> – ядро слоту, – термінальні рядки, – залежні слоти з аналогічною структурою:
. (16)
Правила (17-21) показують варіанти структури слота. Додаткові знаки „*” і „!” вказують на обов’язковість підстановки одного зі значень замість нетермінального символу. Знак „&” вказує на можливість підстановки декількох значень нетермінального символу одночасно. Знак розширеної нотації формальних граматик „+” означає обов’язкову підстановку одного або декількох значень замість нетермінального символу.
(17)
(18)
(19)
(20)
. (21)
Правила (22-23) описують варіант залежності слотів у шаблоні (слоти У>ik> і У>il> залежать від У>ij>) у разі обов’язкової та необов’язкової клінічної характеристики. Відповідні правила для формул (19)-(20) будуються аналогічним чином.
(22)
(23)
Правило (24) визначає варіанти значень нетермінального символу, якими можуть бути як термінальні символи, так і певна кількість шаблонів-значень ()
. (24)
Шаблон-значення може бути організований з m-1 слотів-атрибутів, де m – кількість нетермінальних символів в алфавіті, які визначають клінічні характеристики діагнозу
. (25)
Отже, модель синтаксичної складової класифікації формується множиною граматик, кожна з яких є компактним записом усіх варіантів визначеного діагнозу.
Таким чином, описана модель визначає синтаксичну складову слоту клінічної характеристики, її компоненти, їх порядок у слоті та у фреймі: залежні слоти; нетермінальні символи; термінальні рядки, що можуть існувати перед клінічною характеристикою, після неї, та взагалі після слоту; правила трансформації.
Модель семантичної складової класифікації формується на базі дескриптивної логіки, що дозволяє віднести мову опису класифікації до формалізованих мов, визначити її переваги і недоліки, можливі шляхи розвитку. Дана модель зводиться до термінологічної аксіоми спадкоємства, а також до набору конструкторів концептів клінічного діагнозу (табл. 1,2). Таким чином, логіку класифікації клінічних діагнозів віднесено до підмножини мов без можливості використання оператора “обмеження на існування”.
Таблиця 1
Конструктори концептів клінічної класифікації діагнозів
Оператор |
Нотація дескрипційної логіки |
Вершина сіті |
|
За межами сіті |
|
Кон’юнкція |
|
Імплікація |
|
Обмеження на значення |
|
Обмеження на мінімальне число значень |
|
Обмеження на максимальне число значень |
Таблиця 2
Відповідність конструкторів концептів запропонованої класифікації
Спрощена Нотація |
Приклад |
Нотація логіки |
Опис |
---|---|---|---|
*Axis |
{*F} фаза захворювання |
Необов'язкова клінічна характе-ристика діагнозу |
|
{*Axis1 {*Axis2}} |
{*T{*F}} |
Характеристика F може бути задана, якщо задана характе-ристика T |
|
Axis& |
{*O&} ускладнення |
Можливість завдання декількох значень характеристики одночасно |
|
!Axis |
{!T} ст. важкості |
Обов'язкова характеристика |
Формалізмом, здатним описати семантично-синтаксичну модель клінічного діагнозу, є фреймова і, відповідно, об’єктно-орієнтована мови опису знань. Фреймова модель класифікації є композицією наступних складових: аксіом та переліку конструкторів, здатних описати фрейм-концепт(табл.1,2); структури слоту з визначенням відповідних граней (табл.3); функціональної складової класифікації, яка може бути визначена як набір команд мови керування класифікацією та базується на перших двох складових. Основу функціонального рівня класифікації складають команди управління фреймовою мережею класифікації на основі описаної структури. Серед особливостей відзначимо наявність команд завдання абстрактних фреймів, які складаються з певної множини слотів характеристик, успадкування від абстрактних фреймів тощо. Так, процес успадкування від абстрактного фрейму формально описується як правило:
, де F − абстрактний фрейм, C − фрейм, F.S – множина слотів супер-фрейму, Copy – предикат, що описує процес копіювання відповідної частини мережі, яка пов’язана з успадкованим слотом, GT – предикат, який описує синтаксичну трансформацію термінів при успадкуванні на основі описаних правил GTRules для даного слоту.
Таблиця 3
Загальна структура слоту
Ім’я грані слоту |
Опис грані слоту |
SuperSlot |
Слот, від якого наслідується даний |
MemberSlot |
Ідентифікатор слоту |
SlotIsDependentOf |
Слот, від якого даний залежить |
ValueClass |
Ім’я концепту (фрейму), з яким задається відношення |
Cardinality.Min |
Обмеження на мінімальну кількість значень |
Cardinality.Max |
Обмеження на максимальну кількість значень |
OrderInFrame |
Порядок слоту у фреймі |
OrderInSlot |
Порядок підпорядкованого слоту в слоті |
DirectionForOrderInSlot |
Покажчик напрямку місцезнаходження підпорядкованого слоту в слоті |
TerminalString1 |
Термінальний рядок перед клінічною характеристикою |
TerminalString2 |
Термінальний рядок за клінічною характеристикою |
TerminalString3 |
Термінальний рядок, який стоїть за слотом у фреймі |
Перехід до об’єктно-орієнтованої моделі здійснюється наступним чином: структурна частина отриманої фреймової репрезентації відображається на даталогічну модель, а функціональна − на об’єктно-орієнтовану модель, яка описує контур керування класифікацією.
Концептуальна модель класифікації надана на рис. 1. Основою класифікації є композиція класів Frame та Slot, що відповідає за репрезентацію фреймової мережі клінічних діагнозів. Особливістю моделі є використання циклічного зв’язку на базі шаблону Composite, що дозволяє репрезентувати мережу з необмеженою кількістю рівнів ієрархії „частина-ціле”. Залежність слотів у рамках фрейму (конструктор імплікації слотів) визначається циклічним зв’язком класу Slot, що дозволяє задати нескінчену кількість вкладених слотів. Класи AFrameFrame та AFrameSlot відповідають за реалізацію механізму успадкування фреймів-концептів від абстрактних фреймів, при цьому передбачається можливість реалізації часткового успадкування. Важливою особливістю при реалізації успадкування є існування механізму граматичної трансформації філерів визначеного слоту, при якому зі значенням слоту абстрактного фрейму можуть бути пов’язані схеми граматичної трансформації, які визначаються композицією класів GT, GTItem, GTTypeID: клас GT визначає схему трансформації; клас GTItem визначає елементарну трансформацію в рамках фрейму-значення; GTType визначає тип трансформації. Елементарною трансформацією можна вважати заміну вказаних маркерів (Marker) в значенні атрибуту TS0 відповідного фрейму на фразу (Description) за визначеною схемою. Клас Axis відповідає за репрезентацію осей класифікації, тісно пов’язаних з визначенням слотів фреймів. Класи ICD, ICDFrame відповідають за зв’язок з МКХ-10.
Структура таблиці „фрейми” складається з наступних атрибутів: ID - ідентифікатор фрейму; SlotID - ідентифікатор слоту, значенням якого є фрейм; Element - номер характеристики даного класу для даного слоту; TS0 - значення у випадку примітивного концепту або термінальний рядок символів, який передує першому слоту, у разі комплексного, Note - додатковий атрибут для більш детального опису значення характеристики. Структура таблиці „слот” еквівалентна таблиці 3 з доданням атрибуту FrameID, який визначає до якого фрейму відноситься даний слот.
Визначено умови та вимоги до функціональної складової класифікації, які зведено до чотирьох пакетів: робота з класифікацією, робота з базою пацієнтів, взаємодія з іншими термінологічними системами і пошук та аналіз даних по пацієнтам. Побудовано алгоритми та класи керування класифікацією, основними з яких є: CClassificationEntry (репрезентує суб-мережу визначеного фрейму), СNotation (відповідає за нотацію), CCode (відповідає за репрезентацію ієрархічного коду), CFrameValue (відповідає за роботу з фреймом-значенням слоту), CDecoder (відповідає за декодування коду клінічного діагнозу) тощо. Алгоритми пов’язані з обробкою мережі та базуються на використанні механізмів рекурсії, яка виконується логікою програми (переклад на рівень БД не є реальним).
Для того, щоб проаналізувати можливість інтеграції розробленої класифікації з сучасними термінологічними системами, сформовано формальну модель узагальненої термінологічної системи з використанням апарату логіки предикатів, яка об’єднує запропонований підхід з підходами SNOMED CT, UMLS.
Термінологічна система (ТС) надає загальну множину концептів, визначень та термінів (синонімів), які відповідають тим чи іншим концептам та атрибутам, і забезпечує пріоритетну семантичну складову загальної системи: ієрархічні стосунки, стосунки „частина-ціла”, логічне означення концептів. Визначення концепту описують його зміст: можливі атрибути, що задають характеристики концепту, родові стосунки або стосунки „частина-ціле”. Атрибут “PostOperation” посилається на логічну операцію, за допомогою якої складається означення концепту; у разі підтримки ТС декількох логічних операцій можливо додання ще декількох атрибутів задля можливості реалізації формули з дужками.
Розроблена класифікація відповідає за додатковий рівень обмежень щодо семантики описаного діагнозу та за граматичну інтерпретацію. Надбудова даної класифікації пов’язана з термінологічною системою за правилом: кожний фрейм (значення) розробленої класифікації має відображення на концепт термінологічної системи, та кожний слот має бути відображеним на атрибут ТС. Слід особливо відзначити блок класів FrameConstraint, SlotConstraint, ValueConstraint, TypeOfConstraint, які вирішують задачу вилучення несумісних концептів-характеристик у рамках одного формулювання діагнозу. Так, FrameConstraint вказує на існування обмежень та на їх характер у вигляді: „всі комбінації значень усіх атрибутів є консистентними…”; „всі консистентні/інконсистентні окрім…”; „існують консистентні/інконсистентні…”. SlotConstraint – надає обмеження на комбінацію слотів: „поява будь-яких значень двох слотів є інконсистентним/консистентним”; „всі консистентні/інконсистентні окрім”; „існують консистентні/інконсистентні”. ValueConstraint – обмеження щодо комбінацію значень таким чином: „одне значення одного слоту і кожне значення другого слоту є консистентними/інконсистентними”; „одне значення одного слоту і одне значення другого слоту є консистентним/ інконсистентними”.
Таким чином, розроблено механізм взаємодії зі стандартними термінологічними системами, який дозволяє представити розроблену класифікацію як потенціальну частину більш загальної сучасної термінологічної системи для розширення її семантичних та синтаксичних можливостей при описі клінічних діагнозів.
У четвертому розділі розглянуто особливості реалізації ПЗ та впровадження автоматизованого класифікатора клінічних діагнозів, який базується на принципах: перспективності засобів розробки інформаційних систем (технологій проектування та програмування); максимальної незалежності від особливостей технічних особливостей інформаційної платформи (специфіка провайдеру баз даних, операційна система); компонентно-орієнтованого підходу розробки інформаційних систем.
Основу контуру роботи з БД складають ряд програмних класів на основі композиційного використання стандартних засобів мови C# ІDbDataAdapter, ІDbCommand, IDbParameter, HashTable, DataTable, DataSet.
Контур класифікації (рис.2) складається з: редактора класифікації (UCSCD.Editor) та процесора скриптів (UCSCD.ScriptProcessor), які є засобами створення/редагування класифікації експертом (табл.4); бібліотек, що дозволяють здійснювати кодування/декодування клінічних діагнозів, завдання діагнозів пацієнтів, пошук та аналіз, пов’язаний з фактами класифікації в базі пацієнтів. При цьому особливою рисою є забезпечення незалежності класифікації від специфіки ГІС, яка базується на трьох способах використання класифікації: тільки класифікація як сервер термінології на базі API; класифікація і БД пацієнтів на базі API; класифікація і БД пацієнтів на базі візуальних компонентів.
В кінці розділу наведено приклади використання класифікації в підсистемах аналітики і статистики ГІС.
Таблиця 4
Набір основних команд керування класифікацією клінічних діагнозів
Описання команд керування класифікацією |
|
Команда |
Значення |
Putframe :<fn >:<fv> |
Визначити фрейм (Напр.: putframe:C15: Захворювання {!L стравоходу} {, p !W }) |
Putslotvalue:<fn>.<svn>=<sv> |
Визначити філер слоту (Наприклад: Putslotvalue: C15:L1 = шийного відділу) |
Deleteframe:<fn> |
Видалення фрейму (Deleteframe:K25) |
Deleteslot: <fn>.<sn> |
Видалення слоту (Deleteslot:K25:T) |
Deleteslotvalue: <fn>.<svn> |
Видалення філеру слоту(Deleteslotvalue:K25:T1) |
Aframe: <fn>:<fv> |
Визначити фрейм (Напр.: aframe:A1:{!I}{*O}) |
Aframeslotvalue:<fn>.<svn>=<svm> |
Визначити філер слоту абстрактного фрейму (Напр.: Aframeslotvalue: A1:I1 = кровотеч<1>) |
Frameaframe:<afn>[+gtn]:<fn> |
Визначити успадкування фрейму fn від afn, використовуючи схему трансформації (Напр.: Frameaframe:A1+1:C15) |
Gt:<afn>:<gtn>:{<mn>=<mv>;} |
Визначити схему граматичної трансформації для фрейму (Напр.:Gt:A1:1:1=ою;2=ею;3=єю) |
Changeslotaxis:<fn>:<sn>1>>><sn>2>> |
Зміна осі (Changeslotaxis:K29.4: K>S) |
Moveframe:<fn>1>>:<fn>2>> |
Зміна імені фрейма (зв’язок фрейму з іншим кодом МКХ-10) |
Icd10:<fn>.<svn>:<icd10n> |
Поставити у відповідність кодової комбінації класифікації код МКХ-10. (Icd10:K21-O5:K22.2) |
fn - ім’я фрейму; fv - опис фрейму в нотації розробленої класифікації; svn – ім’я філеру слоту ; sv – філер слоту; svm - філер слоту з маркерами; sn – ім’я слоту; gtn - номер схеми граматичної трансформації; mn – імя маркеру; mv – значення маркеру; icd10n – код МКХ-10. |
Розуміючи під поняттям інформаційної технології сукупність методів, алгоритмів і засобів щодо репрезентації, зберігання, пошуку, передачі та обробки інформації, слід зазначити, що строга етапність вирішення проблеми створення електронної класифікації клінічних діагнозів, сукупність методів та засобів стосовно формалізації, проектування та реалізації формують інформаційну технологію класифікації клінічних діагнозів, яка може бути використана при розробці класифікацій в інших областях знань (медицини, хімії, біології).
Розглянемо основні етапи та особливості даної технології.
На першому етапі визначено основні вимоги стосовно класифікації: простота та ясність опису множини понять, які складають предметну область (клінічні діагнози); композиційна модель утворення складних понять; контроль семантичної коректності сформованих понять; наявність механізмів граматично-коректних описів закодованих понять.
Методологія формалізації предметної області (другий етап) базується на розділенні семантичної та синтаксичної складових об’єкту класифікації і застосуванні апаратів формальних граматик та дескрипцій них логік для їх моделювання, з їх подальшим об’єднанням на базі фреймового підходу опису знань, оперуючи формалізмами фреймів, слотів, граней.
Семантико-синтаксична модель на базі фреймового підходу об’єднує моделі семантичної та синтаксичної складових класифікації та описується: аксіомами та переліком конструкторів, пов’язаних з визначенням фрейму (табл.1, 2); структурою слоту (табл.3); визначенням функціональної складової класифікації (табл. 4).
На третьому етапі здійснюється відображення фреймової моделі класифікації на концептуальну та даталогічну моделі, які створюється з застосуванням шаблону Composite на базі об’єктно-орієнтованого підходу до проектування. Алгоритми роботи з класифікацією базуються на рекурсії, дозволяючи проводити ефективну роботу зі складними мережами.
Механізми зберігання та пошуку фактів (діагнозів пацієнтів) базуються на нормалізації ієрархічного коду і використанні опертатора SQL-92 LIKE, що дозволяє забезпечити компактне зберігання та швидкий пошук в БД.
На четвертому етапі здійснюється моделювання інтеграції розробленої класифікації зі стандартними, вже існуючими термінологічними системами. Результатом показано як класифікація може бути інтегрована в сучасну термінологічну систему з метою її доповнення відповідно термінології клінічних діагнозів.
Реалізація класифікації (п’ятий етап) базується на принципах відкритості та компонентності, що дозволяє її використання в вже існуючих системах.
Таким чином, зміст, обумовленість та тісний взаємозв’язок представлених етапів дозволяє стверджувати, що комплекс методів і засобів математичної та програмної підтримки, пов’язаний зі створенням семантико-синтаксичної класифікації клінічних діагнозів, складає інформаційну технологію класифікації клінічних діагнозів на основі семантико-синтаксичної моделі.
У п’ятому розділі розглянуто особливості розробки госпітальної системи в контексті створення гнучких, легко адаптивних інформаційних систем. Особлива роль при цьому відведена організації, формі надання та використанню метаінформації для вирішення задач динамічної зміни або адаптації інтерфейсу користувача та підсистеми аналітики. Так, у рамках завдання побудови гнучкої госпітальної інформаційної системи запропоновано модельно-орієнтований підхід з використанням фреймової парадигми для побудови моделі системи, що дозволяє не тільки розширити метамову, яка стоїть над формалізмами моделей об’єктно-орієнтованого проектування шляхом включення додаткових граней, але й по-новому розглянути шляхи подання метаінформації.
Сутність підходу полягає в відображенні метаінформації, що міститься у зовнішньому джерелі, на ту або іншу функціональну вісь системи. Головною відмінністю від шаблону TypeSquare можна вважати виділення в окремий клас безлічі граней які описують атрибути. Крім того, виділено комплексні атрибути (слоти), які забезпечують зв'язок з концептами, задані гранями (обмеження на значення, тип умови). Так, безліч збережених об'єктів предметної області (сутності) можна розділити по типу на статичні (довідники) і динамічні. Кожна сутність має безліч атрибутів, які можуть бути простими (приймати значення, обмежені лише типом і розміром) або бути посиланнями на інші сутності (тобто бути слотами або зовнішніми ключами). При цьому на слоти можуть накладатися обмеження як за характером значення (наприклад, хірурги — це доктори зі спеціалізацією "хірургія"), так і за обов'язковістю завдання значення (якщо значення слота/атрибута не задане або задане невірно – примірник сутності не має змісту). З кожним із атрибутів/слотів може бути пов'язане певне число граней, які визначають їхнє відображення на ту або іншу функціональну вісь системи.
Визначено безліч можливих граней атрибутів, необхідних для опису моделі, яка може бути реалізована в завданнях побудови гнучкої підсистеми введення даних, що включає в себе створення інтерфейсу користувача, введення та контролю введеної інформації, а також підсистеми аналізу інформації, був отриманий наступний варіант відображення моделі в реляційні таблиці (рис. 3).
Структура таблиці sconcept складається з атрибутів: Name (ім’я концепту або таблиці в БД); OwnerID (посилання на концепт); TypeID (тип концепту, наприклад, концепт користувача, системний концепт, довідник); Description (природне ім'я концепту для відображення в інтерфейсі програми).
Структура таблиці sattribute складається з атрибутів: TableID (ID таблиці до якої належить атрибут), Description (опис атрибута), Name (природне ім'я атрибута для роботи с таблицями), Type (тип атрибута), Size (Розмір поля атрибута), Readonly (Прапор „тільки читання” для атрибута), Width (Ширина атрибуту в пікселях для відображення його на екрані), Caption (Підпис атрибуту, який виводиться на екран для користувача), VR (Обмеження на значення атрибута), FKey (ID концепту, з яким пов'язаний атрибут), PKey (прапорець, чи є цей атрибут первинним ключем свого концепту), Norder (порядковий номер атрибуту для виводу на екран), NRMin (мінімальне значення даного атрибуту), NRMax (максимальне значення даного атрибуту), iVR (додаткова умова або умови, що пов'язують можливі значення атрибута з контекстом системи), SlotType (тип зв'язку із зовнішнім концептом), DefaultFunction (значення за замовчанням).
Підсистема статистики. Так, приймаючи до уваги різноманітність і динамізм зміни статистичних форм звітності ДЛЗ України, а також формування поза-звітних форм для внутрішнього використання в ЛЗ, було обрано рішення для побудови цієї підсистеми на базі програмного шаблону „інтерпретатор” у рамках загального напрямку “захист коду від варіацій”, що найбільш відповідає запропонованим вимогам. Зміст підходу полягає в тому, що логіка побудови звіту виноситься в деяке зовнішнє стосовно системи джерело (файл, таблицю бази даних), яке може бути частково або повністю доступним користувачам з певними правами доступу. У загальному випадку, користувач може як змінювати саму логіку побудови вже існуючого звіту (алгоритм його формування), так і створювати нові звіти, при цьому код програми залишається незмінним. У цьому випадку сама програма працює як інтерпретатор команд користувача, описів, правил у реальні звіти. Зміна логіки побудови звіту може виконуватися двома способами: шляхом додавання SQL-команд з наступним заповненням стовпчиків примірника таблиці-шаблона звіту; шляхом додавання рядка з описом створення екземпляра компоненту та подальшим викликом його методів. Підсистема припускає незалежне використання компоненту виводу на друк і логіки побудови звіту. Загальна модель класів підсистеми представлена на рис. 4.
Таким чином, на основі моделі класів, підсистема статистики дозволяє: динамічно створювати, змінювати структуру та алгоритми формування звітів; налагоджувати форму виводу; задавати механізми контролю формування звітності. При реалізації підсистеми статистики розглянуто питання розробки інтерфейсу, який дозволяє динамічно змінювати форму і алгоритми формування існуючих форм або будувати нові форми звітів на базі програмного шаблону „інтерпретатор”; створено механізми контролю формування звітів і перевірки адекватності отриманих результатів шляхом будування контрольних списків пацієнтів, звірки отриманих значень тощо; розглянуто систему налагодження інтерфейсу виводу звітів (завдання заголовків, методу виводу, шрифту тощо).
Стосовно особливостей проектування та реалізації підсистеми аналітики визначено: структуру метаінформації, що дозволяє формувати аналітичні вибірки; основний алгоритм формування звітів двох видів (одержання значення шуканих атрибутів за результатами сформованої вибірки; аналіз результату шляхом створення аналітичних звітів, що досліджують залежність параметрів різного класу).
ВИСНОВКИ
У дисертаційній роботі дано нове рішення задачі розробки та реалізації інформаційної технології семантико-синтаксичної класифікації, головною ознакою якої є поєднання принципів компактності та повноти опису клінічних діагнозів, що дозволяє суттєво спростити процес завдання та обробки клінічних діагнозів в інформаційних системах.
В ході аналізу отриманих результатів були зроблені наступні висновки:
Простота в користуванні, компактність, врахування семантичних обмежень на формування діагнозу та обов’язкове надання механізмів формування синтаксично правильних описів діагнозів є основними факторами, які впливають на впровадження автоматизованого класифікатора клінічних діагнозів в лікувальні заклади України.
Для забезпечення можливості повної репрезентації сутності класифікації клінічних діагнозів формальна модель клінічного діагнозу повинна включати семантичну і синтаксичну складові, описані на базі формальних граматик і дескрипційної логіки.
Концептуальна модель класифікації діагнозів, основана на формальної семантико-синтаксичної моделі з використанням фреймового і об’єктно-орієнтованого підходів опису знань, є базою для структурної та функціональної складових класифікації клінічних діагнозів.
Особливістю даталогічної моделі, яка відображає класифікацію в схему реляційної бази даних, є використання шаблону Composite, що обумовлює збереження мережі фреймів класифікації.
Розроблена мова керування класифікацією забезпечує можливість завдання абстрактних фреймів, які складаються зі слотів клінічних характеристик, спадкування фреймів діагнозів від абстрактних фреймів і керування фреймами діагнозів.
Розроблений механізм взаємодії розробленої класифікації зі стандартними термінологічними системами, описаний кодами взаємодії, дозволяє представити розроблену класифікацію як потенціальну частину більш загальної сучасної термінологічної системи, поширюючи її семантичні та синтаксичні можливості при описі клінічних діагнозів.
Використання розробленої автоматизованої класифікації в госпітальної інформаційної системі дозволяє деталізувати статистичні та аналітичні форми звітності лікувального закладу, що надає додаткову інформацію для удосконалення лікувально-діагностичної діяльності стаціонару.
Технологія проектування аналітичної підсистеми та підсистеми статистики госпітальної інформаційної системи на базі метаінформаційного підходу дозволяє скоротити витрати, пов’язані з побудовою стандартних та розширених звітних та аналітичних форм, а також зробити більш швидкою адаптацію розробленої госпітальної інформаційної системи до іншого лікувального закладу.
ПЕРЕЛІК ДРУКОВАНИХ РОБІТ, ЩО ОПУБЛІКОВАНІ ЗА ТЕМОЮ ДИСЕРТАЦІЇ
Литвинов А. А. Использование метаинформации при построении аналитической подсистемы медицинской госпитальной системы // Системные технологии. Рег. межвуз. сб. науч. работ. – Выпуск 6(41). – Днепропетровск, 2005. - C. 105-114.
Литвинов А. А. Использование метаинформации при реализации пользовательского интерфейса медицинской госпитальной системы. Сб. тез. докл. по мат. Межд. научно-практ. конф. “Математическое и программное обеспечение интеллектуальных систем”. Днепропетровск, 2005. - C.106-107.
Litvinov A. A. The structure of electronic classification of disease for Ukrainian medical information systems //Сб. тез. докл. по мат. Междунар. научно-практ. конф. “Математическое и программное обеспечение интеллектуальных систем”. Днепропетровск, 2006. - C.98-99.
Литвинов О. А. Формалізація клінічного діагнозу і модель електронної класифікації діагнозів для Медичних Інформаційних Систем України. // Системные технологии. Рег. межвуз. сб. научн. работ. – Выпуск 2(49). – Днепропетровск, 2007. - С.46-56.
Березницький Я. С., Литвинов О. А. Комп’ютерна програма „Унифицированная клинико-статистическая классификация болезней (УКСКБ) органов пищеваниения”. Свід. про реєстр. на твір № 8958. Дата реєстрації 12.12.2003.
Березницький Я. С., Литвинов О. А., Ксікевич Л. М. Комп’ютерна програма „Meddoc”. Свід. про реєстр. на твір № 14980. Дата реєстрації 07.12.2005.
Коваленко А.С., Литвинов А.А., Голубчиков М.В. Особенности проектирования подсистемы статистики госпитальной информационной системы //УСиМ. – Вып. 5(211). – К., 2007. – С. 61–68.
Литвинов А. А. Модели и алгоритмы компьютерной обработки диагнозов на базе УКСКБ. – Днепропетровск: Научная книга, 2000. – 64 c.
Литвинов А. А., Пеньков А. П. Инфологическая модель обобщенного лечебного учреждения // Системные технологии. Рег. межвуз. сб. научн. работ. № 5. – Днепропетровск, 2001, С. 56-60.
В. С. Хандецкий, А. А. Литвинов. Методика формирования модели диагноза на базе унифицированной клинико-статистической классификации болезней. Информационные технологии. - № 4, 2002. Москва. Машиностроение.- C. 49-54.
Литвинов А. А. Реализация механизма аналитических выборок в информационных аналитических системах.// Сб. тез. докл. по мат. Междунар. науч. конф. “Теория и техника передачи, приема и обработки информации”. Харьков-Туапсе, 2003. - С. 451-452.
Литвинов А. А. Использование кэш-справочников в медицинских информационных системах //Системные технологии. Рег. межвуз. сб. науч. работ. – Вып. 5(28). – Днепропетровск, 2003. - С.75-80.
Литвинов А. А. Использование метаданных при проектировании и реализации медицинской информационной системы // Системные технологии. Рег. межвуз. сб. науч. работ. – Выпуск 6(35). – Днепропетровск, 2004. - С.33-39.
Литвинов А. А. Использование фреймовой классификации диагнозов в медицинской информационной системе. //Сб. тез. докл. по мат. Международной научно-пратической конференции “Математическое и программное обеспечение интеллектуальных систем”. Днепропетровск, 2004. - С.83-84.
Анотації
Литвинов О. А. Інформаційна технологія класифікації клінічних діагнозів на основі семантико-синтаксичної моделі. – Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.09 – Медична та біологічна інформатика і кібернетика. – Міжнародний науково-навчальний центр інформаційних технологій та систем НАНУ і МОНУ, Київ, 2008.
Дисертація присвячена розробці інформаційної технології класифікації клінічних діагнозів, що відповідає вимогам ЛПЗ України.
Для досягнення цієї мети проведено аналіз існуючих класифікацій медичної термінології та виділено пріоритетні вимоги та форму класифікації для ефективного використання в госпітальній інформаційній системі. Проведено формальний опис клінічного діагнозу як елемента класифікації. Запропоновано концептуальну та даталогічну модель клінічної класифікації діагнозів. Розроблено та реалізовано комплекс програмних компонентів для ефективного використання пропонованої класифікації. Розроблено та реалізовано механізми узгодження даної класифікації зі стандартними термінологічними системами.
Розроблена класифікація впроваджена в розроблена госпітальну інформаційну систему. До особливостей розробки госпітальної системи слід віднести використання шаблону проектування „інтерпретатор” для підсистеми статистики, що дозволяє досягнути гнучкості архітектури даної підсистеми, та розробку підсистеми аналізу інформації на засадах метаінформаційного підходу з застосуванням фреймової парадигми опису знань.
Результати дисертації були використані для побудови госпітальної інформаційної системи, впровадженої на базі міської лікарні № 6 Дніпропетровська та клініки ООО „Ендотехномед”, розробки стандартів медичної допомоги на базі Інституту гастроентерології АМН України, в навчальному процесі кафедри факультетської хірургії та хірургії інтернів Дніпропетровської державної академії
Ключові слова: інформаційна технологія, термінологічна система, діагноз, госпітальна інформаційна система, концептуальна модель, метаінформація, шаблон.
Литвинов А. А.Информационная технология классификации клинических диагнозов на основе семантико-синтаксической модели. – Рукопись.
Диссертация на соискание ученой степени кандидата технических наук по специальности 05.13.09 – Биологическая и медицинская информатика и кибернетика. – Международный научно-учебный центр информационных технологий и систем НАНУ и МОНУ, Киев, 2008.
Диссертация посвящена разработке информационной технологии классификации клинических диагнозов и направлена на усовершенствование информационного обеспечения госпитальных учреждений Украины, а также создание информационной базы для разработки медицинских стандартов.
Для достижения поставленной цели проведен анализ существующих терминологических систем и выделены приоритетные условия и форма классификации для эффективного использования в госпитальной информационной системе. Проведено формальное описание клинического диагноза как элемента классификации. Предложена концептуальная и даталогическая модель клинической классификации диагнозов. Разработан и реализован комплекс программных компонентов для эффективного использования разработанной классификации. Разработаны механизмы согласования данной классификации с существующими стандартными терминологическими системами.
Разработанная классификация внедрена в разработанную госпитальную информационную систему. К особенностям разработки госпитальной системы следует отнести: использование шаблона проектирования “интерпретатор” для подсистемы статистики, что позволяет достичь гибкости в вопросах реализации и адаптации данной подсистемы; разработку подсистемы анализа информации на базе метаинформационного подхода с использованием фреймовой парадигмы описания знаний.
Результаты диссертации были использованы при создании госпитальной информационной системы городской клинической больницы № 6 Днепропетровска и клиники ООО “Эндотехномед”, разработки стандартов медицинской помощи на базе Института гастроэнтерологии АМН Украины, в образовательном процессе на кафедре факультетской хирургии и хирургии интернов Днепропетровской государственной академии.
Ключевые слова: информационная технология, терминологическая система, диагноз, госпитальная система, концептуальная модель, метаинформация, шаблон.
Litvinov A. A. Information technology of classification of clinical disease based on semantic-syntactical model. – Manuscript.
The thesis for candidate degree of technical science in medical and biological informatics and cybernetics (05.13.07). – International Research and Training Centre of Information Technologies and Systems, Kyiv, 2008.
It’s obvious that the statistical and research needs of modern hospitals and medical research institutes require more detailed and sophisticated classification than ICD-10 (international classification of disease, tenth revision), the standard classification recommended by the WHO (World Healthcare Organization). There are a number of alternative classifications have been built by the groups and organizations of the developed countries such as USA and UK, latest of them are based on compositional principal which made them more flexible in use and easy-extensible than ICD. Another specific feature of the classifications is covering (representing) all the medical terminology (not only diseases). But, the known alternatives of ICD-10 are too expensive to be implemented and have a number of declared disadvantages and constraints. Thus, it makes a barrier for adaptation process and it seems impossible use of them in Ukrainian hospitals. So, the design of effective classification of disease easy to use and considering peculiarities of Ukrainian hospitals is an actual question for medical informatics of Ukraine.
The given work is devoted to design of informational technology of clinical classification of disease and directed to solve the problem of clinical terminology representation in medical information systems considering specific of Ukrainian hospitals.
To achieve the goal the following steps were made.
First, main modern terminological systems were analyzed and core requirements were gathered selecting primary issues considering Ukrainian hospital needs and abilities. There are four primary requirements were stated for desired classification: simplicity and clarity of use of the classification supporting even a manual coding; compositional coding model; semantic restrictions allowing only semantically correct compositions; syntactically correct natural-language sentences as a result of decoding.
Using the defined requirements and informal description of the domain of problem design we’ve built a formal semantic-syntactical model of clinical diagnosis which serves as the basis of the classification. The model consists of two components: semantic part which is formalized using description logic and syntactical part which is formalized using Chomsky grammar. Then, two components of formal model have been linked on the basis of Frame-based knowledge representation approach and form the frame-based model of the classification which consequently was transformed into object-oriented representation using Composite pattern which causes an effective work with complex multi-level network structures.
Then, there were designed a model, mechanisms and methods of compatibility of the designed classification and standard terminology systems such as SNOMED CT. There has been proved that the designed classification plays a role of global terminology system’s extension which makes a work with clinical diagnosis domain more simple, coherent, gets additional level of semantic restrictions and syntactical mechanisms to form only semantically and syntactically correct concepts.
Thus, as a result of the modeling, the conceptual and datalogical model of the classification, and requirements, rules and formal description of its framework were suggested, that further caused its realization and implementation forms.
The realization of the classification framework based on principles of openness, component-oriented structure, flexibility, independency of technical level (database provider and operational system), which implies its implementation in an already existed working hospital information system.
If we think of the meaning of information technology concept as a set of methods, algorithms and tools used for representation, storage, retrieval and processing of information, it could be noted that the composition of clinical classification construction’s problem solution phases, phases’ interaction and dependency, mathematical, design and programming methods and approaches used for formalization, design and realization of the classification, forms the information technology applied to realize of classification of disease based on semantic-syntactical model, and can be used to develop classifications in different domains and sub>-domains such as medicine, biology, chemistry.
At the last stage, hospital system using the classification as a terminology server for disease coding, storing, representing activities used in statistical and analysis sub>systems, has been realized and deployed on the basis of Dnipropetrovs’k clinical hospital #6. Specific features of the system are as follows: the “Interpreter” design pattern used for statistic sub>system realization that makes this part more flexible and easy-adoptable for hospital end-user requirements and conditions; metainformation-driven approach using frame-based paradigm of knowledge representation as its core used for analysis sub>system design and realization.
Dissertation results were used for: building the hospital information system of Dnipropetrovs’k clinical hospital #6 and “Endotechnomed” clinic; medical care standards design tasks performed by the Gastroenterology institute of AMS of Ukraine; realizing software for educational process in surgery sub>-faculty of Dnipropetrovs’k State Academy.
All the given results could serve as a platform for further research in the direction of constructing classifications, improving existed and developing new flexible, easy-extensible hospital systems.
Key words: information technology, terminological system, disease, hospital information system, conceptual design, metainformation, pattern.