Информационные технологии управления знаниями

Информационные технологии управления знаниями

Гаврилова Т. А., Кудрявцев Д. В.

Рассматривая управление знаниями (УЗ) как совокупность процессов, которые управляют созданием, распространением, обработкой и использованием информации внутри предприятия [Джанетто, Уилер, 2005], мы сразу принимаем междисциплинрность и многоаспектность данного понятия. В данной статье будет кратко обсуждаться новые информационные технологии, помогающие организовать современную систему УЗ (СУЗ) на предприятии.

1. Введение и некоторые классификации

Размытая трактовка понятия «знания», которое используется в УЗ крайне свободно и широко (см. статью про инженерию знаний), требует уточнения. В СУЗ знаниями называют все виды информации, включая неструктурированный контент (письма, эскизы, фото), данные (в базах данных и хранилищах данных), и знания (как закономерности предметной области, позволяющие специалистам решать свои задачи). Подробнее об этом в статье про инженерию знаний.

Обмен и передача знаний в рамках одной организации обычно принимают форму создания баз знаний, обеспечивающих накопление и повторное использование знаний [Циперман, 2005, Haghi, 2005]. Передача знаний и опыта между организациями формирует рынок знаний, для ориентации в котором создаются соответствующие инструменты [Abecker, van Elst, 2003].

Таким образом, ресурсы знаний в широком смысле могут находиться в различных местах — в базах данных, базах знаний, картотечных блоках, у специалистов — и рассредоточены по всему предприятию.

Существуют различные классификации технологий УЗ [Marwick, 2001; Мильнер и др., 2006; Davies et al, 2005], например, в [Гаврилова, 2008], все инструменты СУЗ разбиты на 7 классов:

Анализ имеющейся в компании информации,

Извлечение, структурирование и формализация знаний (иначе, инженерия знаний),

Обмен и использование знаний,

Поиск информации по запросу,

Организация хранения,

Обучение, .

Интегрированные системы обработки, объединяющие вышеперечисленные функции.

Ценность данной классификации в охвате и представлении единого взгляда на весь комплекс задач управления знаний. Однако, если попытаться шире взглянуть на все многообразие средств УЗ, можно опереться на отчеты известной Gartner Group (http://gartner.com/). Среди многообразия програмных продуктов Gartner выделяет три категории, которые полностью поддерживают решение задач УЗ:

А. Технологии доступа к информации (Information Access Technology) [Andrews, 2007].

В. Совместная работа и социально-ориентированное ПО (Collaboration and Social Software) [Dracos, 2007].

С. Системы управления контентом (Enterprise Content Management), которую также можно рассматривать как инфраструктуру для представленных выше групп

Две первые категории соответствуют 2-м различным взглядам на знание [van Engers, 2001; Abecker and van Elst, 2003]:

1. Знание как «запас». Согласно этому подходу, знание – это актив, продукт, который может существовать независимо от человека и управление которым подобно управлению любыми другими ресурсами.

2. Знание как «поток». В таком подходе знание не может передаваться как некий объект, поскольку в формирование знания вносит существенный вклад человек-участник процесса передачи. Данный взгляд объясняется тем, что знание – результат интерпретации информации в определенном контексте. Знание не передается, а воссоздается в мозгу человека при получении информации в соответствии с исходными знаниями, опытом, ценностями и ожиданиями.

На практике оба взгляда часто сочетаются.

2. Лидеры программных средств для управления знаниями

Рассмотрим некоторых типичных представителей и функциональные возможности программных средств, относящихся к сформированным категориям.

Категория А. «Технологии доступа к информации».

Что включает понятие доступа? Конечно, в первую очередь - поиск по ключевым словам и сложные запросы (например: «Найти все отчеты отдела маркетинга, которые писал Иванов?”). Также важен поиск с использованием классификации (или таксономии) документов по группам.

Некоторые программы могут сами аннотировать любого входнй документ и строить автоматическаи классификации по текстам документов.

Лидерами в данной категории в соответствие с [Andrews, 2007] являются продукты компаний Autonomy (IDOL™ Server), Fast Search&Transfer (FAST ESP, Convera RetrievalWare), Endeca, IBM.

Категория В. «Совместная работа групп и социально-ориентированное ПО».

Эти программные продукты поддерживают коммуникации (мгновенные сообщения, почту, IP-телефонию, видео-конференции) и предоставляют единую виртуальную рабочую среду, включающую wiki (термин описандалее), совместную работу с документами, рабочие доски и пр.. Так можно организовать совместную разработку отчета в едином пространстве, выделив сообщество участников, или организовать коллективное обсуждение корпоративного праздника. Программы этой категории создают персональные профили сотрудников с описанием интересов, компетенции, опыта работ и т.п., а также каталоги экспертов.

Лидерами в данной группе являются продукты компаний BEA (BEA Aqualogic), SpikeSource (SuiteTwo), Socialtext (Socialtext), IBM и Microsoft[Dracos, 2007].

Категория С. «Системы управления контентом (Enterprise Content Management)»

Эта группа программ включает различные иструменты для гибкой и надежной работы с документами, например, регистрацию, управление версиями, безопасность, сканирование и распознавание. Также сюда относят создание архивов, наполнение, обновление и структурирование содержимого сайтов, организация взаимодействия с посетителями сайтов.

Лидерами в данной категории в соответствие с [Shegda et al, 2007] являются продукты компаний IBM (Content Manager, Filenet P8), EMC (EMC Documentum), Opentext (Livelink ECM 10).

Основными поставщиками интегрированных решений для разработчиков программных средств управления знаниями являются компании IBM, EMC, Opentext и Microsoft. Эти компании стараются покрыть функциональными возможностями своих программных продуктов весь комплекс задач управления знаниями. Компания IBM занимает лидирующие позиции во многих классах программных продуктов, поэтому далее будет детально рассмотрена ее продуктовая линейка.

Определение состава продуктов для управления знаниями проводилось с учетом [Богданова Е., 2006; Бизнес в паутине социальных сетей, 2007; Дёрре И. и др., 2007; IBM 208; IBM OmniFind Enterprise Edition, 2008]. Программы других поставщиков имеют сходный функционал, отличаясь лишь технологиями реализации, а также качеством и эффективностью работы.

Продукты категории А - «Технологии доступа к информации»

IBM OmniFind

OmniFind ориентирован на поиск информации для работников организации и клиентов. Поиск может одновременно проводиться по всем ресурсам - в интранете, по внешним корпоративным сайтам компании, в базах данных, и т.д.

Omnifind предоставляет полнотекстовый поиск по ключевым словам и фразам для начинающих пользователей, а также расширенные виды поиска для продвинутых пользователей. Система позволяет также задавать правила для автоматической классификации документов.

IBM Classification Module

Данный модуль автоматически классифицирует неструктурированный контент по заданным категориям, а также повзоляет создавать и настраивать таксономии. Эта программа выступает дополнением к IBM Omnifind, которое позволяет повысить эффективность и точность поиска с помощью навигации (browsing) и наложение ограничений на результаты поиска (например, поиск только в определенной категории).

WebSphere Portal

WebSphere Portal - это программная среда, реализующая единую точку индивидуального взаимодействия людей и программ. С точки зрения управления знаниями особенно важно в портале сочетание персонализации контента (взгляд на знание как на «запас») с возможностями совместной работы и обмена неформализованными знаниями (взгляд на знание как на «поток»).

Продукты категории В - средства совместной работа

IBM Lotus Notes and Domino

IBM Lotus Notes - это главная часть программного обеспечения IBM Lotus Domino, который обладает функциями планирования (календарь) и работы с электронной почтой. Продукт является платформой для совместной работы и повышения гибкости предприятия в целом. Близок известному продукту от Microsoft – почтовой системе Outlook.

IBM Lotus Sametime

IBM Lotus Sametime – это программа для общения и совместной работы с возможностью проведения Web-конференций (телеконференций через Интернет). Lotus Sametime позволяет предавать голосовые и видео-сообщения, определять местонахождение участников, и поддерживает связь с мобильными устройствами (например, мобильными телефонами).

IBM Lotus Quickr

IBM Lotus Quickr – это программный продукт для обеспечения совместной работы нескольких пользователей, который помогает организовать совместную работу сотрудников в интерактивном режиме как внутри организации, так и за ее пределами..

В интерактивные рабочие области пользователи могут включать календарь, дискуссионные форумы, блоги, wiki и другие средства совместной работы для управления проектами и создания общего контента.

IBM Lotus Connections

IBM Lotus Connections представляет собой решение для социализации бизнес-процессов, расширяющее инновационные возможности и ускоряющее работу с помощью объединения сотрудников, партнеров и заказчиков в динамические сети.

“Если Lotus Quickr — это управление контентом в контексте проекта, то Lotus Connections предоставляет средства для объединения людей, которые должны сотрудничать в работе над проектом. Система содержит пять основных компонентов: Profiles, Blogs, Communities, Activities и средство создания закладок Bookmarks (Dogear). Используя их, я и мои коллеги в моей организации и, возможно, за ее пределами, знают: что я из себя представляю — Profiles; над чем я сейчас работаю — Activities; чем я интересуюсь — Bookmarks (Dogear); что хочу обсудить — Blogs; с кем нахожусь в контакте — Communities.” – говорит Дэвид Фаррел, вице-президент IBM по программному обеспечению Lotus в регионе Европа, Ближний Восток и Африка [Бизнес в паутине социальных сетей, 2007].

Продукты категории С – системы управления контентом

Далее представлены не все компоненты системы управления контентом, а только те, которые используются для реализации системы управления знаниями.

IBM Content Manager

Это программный продукт для хранения, контроля, распределения и интеграции информации. Интегрирует данные различных форматов (документ, изображение, Web, медиа и другие) и сопрягается с различными профессиональными системами сканирования.

IBM WebSphere Information Integrator

WebSphere Information Integration обеспечивает доступ к данным, хранящимся в разнородных системах, интегрируя содержимые порталов, бизнес-приложений и других программ. Этот интегратор делает так, что множество разнородных хранилищ данных выглядят и функционируют как единый архив.

3. Некоторые отечественные программы

Среди отечественных продуктов, позиционирующихся как системы для поддержки УЗ, следует отметить несколько:

1) Система "Айкумена Аналитик" компании IQMen (http://www.iqmen.ru/our_proposal/ ) обеспечивает информационно-аналитическую поддержку принятия решений c помощью таких современных технологий как:

Автоматический сбор информации из разнородных источников: электронные СМИ, аналитические агентства, специализированные базы данных.

Автоматическое составление и рассылка индивидуальных тематических отчетов экспертам и руководству.

Средства графического анализа событий по любой тематике, оперативное выявление в новостном потоке горячих тем.

Мгновенная подготовка досье по любому вопросу.

Выборка наиболее важной фактической информации - дат, финансовых данных, персон и организаций.

Автоматическое выявление физических и юридических лиц, имеющих отношение к любому вопросу и анализ взаимосвязей между ними.

2) Система «Галактика ZOOM» — инструмент для создания хранилища текстовой информации, который обладает возможностями для проведения поиска и аналитических исследований.

Поиск информации в больших информационных массивах.

Выявление значимых слов и словосочетаний документа, отражающих содержание текста.

Сравнение документов - обнаружение сходства, различия и аномалий изучаемых объектов.

Динамика во времени - отслеживание изменений во времени слов или словосочетаний характеризующих изучаемый объект.

3) Система DocsVision также предназначена для задач управления документами и процессами (http://www.docsvision.com/). Система DocsVision "Делопроизводство" для создает архивы документов, автоматизирует делопроизводство в организации.

4) Система ЕВФРАТ-Документооборот (http://www.evfrat.ru) - комплексное решение по организации электронного документооборота на предприятии. Внедрение системы обеспечивает:

систематизацию учета и хранения документов;

оперативный доступ к документам и отчетной информации;

управление процессами движения и обработки документов;

5) Яndex.Server — программа для поиска информации в интернете или в локальной сети с учетом морфологии русского языка.

4. Веб 2.0 инструменты для работы со знаниями

В 2005 году Тим О’Рейли [О’Рейли, 2005] описал концепцию «эволюционировавшей всемирной паутины», которую он обозначил термином Web 2.0, подчеркнув тем самым ее значимость как следующего поколения интернет-систем. Под этим понятием он объединил уже сформировавшиеся к тому времени признаки веб-сайтов «новой волны», основным из которых, с пользовательской точки зрения, можно считать использование «коллективного разума» или, точнее, «коллективной деятельности». Пользователи интернета сами становятся создателями информации - создаваемый в сети контент, его описание и структурирование, оценка и ранжирование становятся результатом деятельность рядовых пользователей. Технологически вовлечение пользователей обеспечивается засчет интерактивность веб-страниц и простоты их интерфейсов – для размещения информации в интернете пользователю не нужно никаких специальных знаний.

Вот неполный список инструментов Веб 2.0:

интернет почта (mail.ru, yandex.ru, gmail.com),

cредства обмена сообщениями (ICQ, google-чат)

блоги (например, Живой Журнал, корпоративные блоги Яндекса, Google-а) – он-лайн журналы и дневники, позволяющие обмениваться мнениями, размещать новости. Обновления блогов могут рассылаться с помощью RSS-потоков – см. далее,

социальные сети (например, vkontakte.ru, moikrug), позволяющие узнать о знаниях, опыте, интересах других людей и представить свои,

средства интеграции и чтения новостных RSS-потоков (Яндекс Лента, Google Reader). RSS (Really Simple Syndication) - средство подписки на обновления новостей сайтов, записей блогов, результатов поиска по определенному запросу и на любые другие обновляемые материалы – фотографии, видео, веб-закладки и т.д.

Peer-to-peer сети (иногда P2P-сети) – средство эффективного обмена файлами (музыкой, видео, текстами) либо через интернет, либо между ограниченным числом пользователей. Данное средство открывает доступ к содержимому персональных компьютеров пользователей и обеспечивает высокую скорость передачи информации, благодаря специальной технологии разделения файла на отдельные фрагменты.

веб-закладки (del.icio.us, БобрДобр), позволяющие пользователям не только сохранять ссылки на интересные для них ресурсы, но и сопровождать их ключевыми словами, обмениваться этими ссылками, анализировать популярность ресурсов (количество ссылок) и тенденции, находить других пользователей со схожими интересами.

средства для размещения фотографий (photosight.ru, flickr.com), презентаций (slideshare) и видео (youtube), с богатыми возможностями описания материалов (теги, категории), поиска, обсуждения.

wiki-средства (pbwiki.com, wikispaces.com) – средства создания и функционирования веб-сайтов по типу Википедии (см. ru.wikipedia.org). Cтраницы вики-сайта совместно редактируются сотрудниками организации и выступают альтернативой письмам и вложениям электронной почты.

программы для коллективного редактирования документов в онлайне (Google Docs),

гибридные приложения (mashups), объединяющие несколько инструментов Web 2.0 между собой или с другими приложениями (например, интеграция географических карт от Google, Yahoo cо средствами размещения фотографий - Panoramio, flickr позволяет пользователям привязывать фотографии к местности)

средства планирования – календари (Google Календарь) и т.п.

К Web 2.0 можно также отнести «ПО как сервис» (Software as a Service, SaaS). Такое ПО работает через интернет, а компания ежемесячно оплачивает услуги сервис-провайдера. Это дешево и удобно. Не нужно покупать дорогие лицензии, устанавливать и настраивать сложный софт.

Более полумиллиона западных компаний успешно используют онлайновую платформу AppExchange от Salesforce.com, что позволяет подписаться на любое из нескольких сотен бизнес-приложений, доступных для подписки (CRM-системы, бухгалтерские программы и др.). В данный момент SaaS значительно уступает по популярности традиционным моделям использования ПО, но в будущем ситуация должна измениться. Gartner прогнозирует, что к 2011 г. доля SaaS в общем объеме рынка программного обеспечения вырастет до 25%, то есть в пять раз по сравнению с 2005 г. [Ализар, 2006]

Инструменты Web 2.0 подходят для поддержки совместной работы в системах управления знаниями: они просты, эффективны и уже знакомы некоторым пользователям. По оценкам компании McKinsey основной целью использования инструментов Web 2.0 в бизнесе является поддержка совместной работы в компании – 75% опрошенных менеджеров (70% - взаимодействие с покупателями, 51% - взаимодействие с поставщиками и партнерами). При этом бОльшая часть респондентов рассматривает совместную работу как инструмент управления знаниями [Bughin, Manyika, 2007]. Рисунки 1 и 2 отражают мнения пользователей, полученные в рамках других исследований, о пользе и препятствиях таких инструментов.

Источник: InformationWeek Research, 2006

Рис. 1. Польза инструментов Веб 2.0 для бизнеса

Источник: InformationWeek Research, 2006

Рис. 2. Препятствия для Веба 2.0 в бизнесе

Вряд ли инструменты Web 2.0 вытеснят с рынка стандартные системы управления документами и софт для групповой работы, но они определенно могут его дополнить и стать неотъемлемой их частью. Собственно, такая интеграция происходит уже сейчас ( см. выше описание IBM Lotus Quickr, Sametime и др.).

В России внедрение в корпоративные системы блогов, wiki и социальных сетей идет несколько медленнее, чем на Западе. Причины заключаются в худшем состоянии технической инфраструктуры. Широкополосный интернет, который является главным условием для развития публичных сервисов Веб 2.0, распространен только в Москве. По этой причине блоги, подкастинг, wiki и прочие современные технологии еще не стали достаточно популярными среди пользователей. Корпоративная культура только начинает приспосабливаться к использованию социально-ориентированных сервисов в бизнесе.

5. Семантический веб и онтологии в управлении знаниями

Сейчас значительная часть содержания Всемирной Сети (World Wide Web) предназначена для чтения человеком, а не для осмысленного манипулирования им с помощью компьютерных программ. Компьютер способен умело разобраться в разметке веб-страницы и произвести рутинную её обработку — тут идёт заголовок, здесь следует ссылка на другую страницу; но у компьютера нет надёжного способа обрабатывать смысл документа: это — домашняя страница компании Х, а эта ссылка ведёт на резюме сотрудников данной компании.

Семантический веб (Semantic Web) привносит смысловую структуру в содержание веб-страниц. Семантический веб — это не какая-то отдельная сеть, а расширение уже существующей, такое, что в ней информация снабжена точно определённым смыслом, позволяющим человеку и машине успешно взаимодействовать.

Сценарий работы таких программных средств представлен в основополагающей статье идеологов семантического веба – Тима Бернерса-Ли и Джеймса Хендлера, опубликованной в 2001 году в журнале Scientific American [Berners-Lee, Hendler, 2001]:

«Пит поднял трубку, звонила его сестра Люси из кабинета врача: «Моей маме нужно попасть на приём к врачу, а потом ей требуется пройти несколько сеансов физиотерапии. Примерно два раза в неделю. Я сейчас поручу своему агенту записать нас на приём к врачу». Пит сразу же согласился подвезти её маму на своей машине. В кабинете врача Люси дала указания своему электронному агенту Семантической Сети через свой портативный веб-браузер. Агент сразу же получил информацию о назначенном маме лечении от агента её врача, просмотрел несколько перечней медицинских учреждений, оказывающих подобные услуги, проверил, какие из них подходят [in-plan] по её страховому полису и находятся в окрестности 20 миль от её дома и при этом имеют рейтинг — «отличный» либо «очень хороший» согласно достоверным рейтинговым источникам. Далее агент попытался сопоставить имеющиеся часы приёма врачей (предоставленные агентами соответствующих мед. учреждений на их веб-сайтах) с расписаниями Пита и Люси. (Слова, выделенные курсивом, указывают на термины, семантика, или смысл, которых была предоставлена агентам посредством Семантической Сети.) Уже через несколько минут агент представил им план. Питу он не понравился — Университетская Клиника расположена на другой стороне города, и ему пришлось бы возвращаться обратно как раз в час пик. Он попросил своего агента повторить поиск с более строгими предпочтениями относительно места и времени. Тем временем агент Люси, полностью доверяя агенту Пита в рамках данной задачи, автоматически помогал, предоставляя тому права доступа и ссылки на уже добытую им информацию. Практически мгновенно был предложен новый план: найденная клиника была уже гораздо ближе, и часы приёма более ранние».

Для того, чтобы Семантический Веб мог функционировать, компьютеры должны иметь доступ к структурированным хранилищам информации и множествам правил вывода, которые могли бы использоваться для проведения автоматических рассуждений. Однако два хранилища информации или базы данных могут использовать различные идентификаторы для обозначения одного и того же понятия, такого, например, как почтовый индекс. И программа, желающая сравнить или как-то скомбинировать информацию из этих баз данных, должна знать, что два конкретных термина используются ими для обозначения одного и того же. В идеале, у программы должен быть способ распознавать подобные термины с одинаковым смыслом, с какими бы базами данных ей не пришлось столкнуться в процессе своей работы.

Решение этой проблемы даётся третим базовым компонентом Семантического Веба — совокупностью информации, которое специалисты именуют онтологией (см. статью про инженерию знаний). В философии онтологией называют некую теорию о природе бытия, ИТ-специалисты заимствовали этот термин, и для них уже онтология — это структура, задающая отношения между понятиями.

Онтология определяет классы объектов и отношения между ними. Например, понятие адрес может быть определено как разновидность понятия местонахождение [location], а код города можно задавать применительно лишь к местонахождениям и так далее. Задание классов, подклассов, а также отношений между индивидами [entities] является чрезвычайно мощным инструментом для использования в Вебе.

В простейшем случае, онтологии используют для увеличения точности поиска в Вебе — поисковая машина будет выдавать только такие сайты, где упоминается в точности искомое понятие, а не произвольные страницы, в тексте которых встретилось данное многозначное ключевое слово.

В полную силу Семантический Веб будет реализован тогда, когда люди создадут множество программ - агентов, которые, знакомясь с содержимым Веба из различных источников, обрабатывают полученную информацию и обмениваются результатами с другими программами. Семантический Веб стимулирует подобного рода синергию: даже те агенты, которые не были созданы специально для работы сообща, могут передавать информацию друг другу, коль скоро эта информация будет снабжена семантикой.

Полноценный Семантический Веб – это технология управления знаниями будущего, однако, уже сейчас можно пользоваться его отдельными технологиями и применять в ограниченных областях. Примером является Семантический веб организации — или реализация этой концепции в рамках отдельной организации [Cerebra, 2005].

Также и онтологии могут не только использоваться в Семантическом Вебе, но и применяться в системах управления знаниями предприятий. Онтологии задают единый язык, повышая тем самым эффективность коммуникаций сотрудников и обмен знаниями. Они могут использоваться для интеграции информации и выполнения простых автоматических рассуждений, повышая тем самым качество результатов поиска информации. Современные исследователи [Mika, Akkermans, 2004; Davies et al, 2005] считают онтологии основной парадигмой управлением знаниями предприятия.

Сегодняшние поисковые системы зачастую выдают бесчисленное множество совершенно не относящихся к запросу «хитов», обрекая пользователя на длительный ручной отбор материала. Например, если вы ввели для поиска слово «орган», то компьютеру совершенно непонятно, имеете ли вы в виду музыкальный инструмент, часть человеческого тела или орган исполнительной власти. Вся проблема в том, что для компьютера слово «орган» не имеет чёткого смысла, или другими словами, семантического содержания.

Онтологии дают возможность производить запросы на основе понятий, а не на основе совпадения строк. Например, если пользователь задаст вопрос «Какие транспортные средства производятся в России?», то он получит из базы ответ, в который попадут автомобили (=подкласс транспортных средств) производимые во Всеволожске (=город, который находится в России).

Также онтологии дают возможность получения не заданных явно знаний из информационных хранилищ путем логического вывода - поиск «скрытой информации». Например, пользователь системы может задать вопрос: Какие поставки продукции находятся сейчас в состоянии риска? В ответ на такой вопрос система в одной онтологии тарифов определит, что с учетом текущих условий (например, географических или погодных) существуют риски связанные с перевозкой овощей и фруктов. А в другой базе или онтологии деклараций по перевозке груза определит, что в декларации №А345 указаны арбузы, которые являются подклассом «Овощей и фруктов» (см. рис. 3). В результате, система сможет дать кокретный ответ на поставленный вопрос: Поставка COSCO #A345

Рис. 3 Интеллектуальный поиск на основе логического вывода

6. Архитектура СУЗ и ее реализация

Для описания типичной современной архитектуры СУЗ мы несколько адаптировали рисунок из работы [Mika, Akkermans, 2004].

Рис. 4. Пример архитектуры СУЗ

Нижний уровень архитектуры (Рис.4) обеспечивает получение знаний из разнородных источников структурированной (базы данных и знаний, таблицы, формы) и неструктурированной (документы) информации. Получение знаний подразумевает аннотирование разнородных источников информации с помощью онтологии, которая позволяет отразить содержание информации. Для получения онтологии используются программные средства автоматического формирования онтологии, поддержки ручной разработки и редактирования онтологии, средства слияния, объединения и оценки качества онтологий. Для аннотирования используются средства автоматической классификации документов по онтологии, извлечения информации из текста и баз данных. Полученные онтологии и метаданные представляются с помощью специальных языков – OWL, RDF.

Промежуточный уровень обеспечивает хранение онтологий и метаданных, управление версиями, доступом, передачу данных для взаимодействия с внешними системами и хранилищами, обработку запросов и логический вывод.

Пользовательские приложения предоставляют пользователям доступ к знаниям, находящимся в системе. Доступ может осуществляться с помощью поискового механизма, средств навигации и визуализации, а также путем непосредственного обмена знаниями между пользователями (например, путем обмена ссылками на ресурсы). Взаимодействие пользовательских приложений с промежуточным уровнем осуществляется с помощью языков запросов и манипулирования данными (например, SPARQL).

Представленная на рис. 4 архитектура может воплощаться в СУЗ полностью или частично. В одних случаях упор может делаться на программную реализацию задач уровня пользовательских приложений – поиск, визуализацию знаний, в других на получение, хранение, интеграцию знаний. В первом случае программная реализация скорее всего будет носить имя «портала знаний», во втором «корпоративной памяти» или «базы знаний».

А) Корпоративная память

Одним из первых инструментов УЗ стали хранилища данных, которые работают по принципу центрального склада. Как правило, хранилища содержат многолетние версии обычной базы данных (БД), физически размещаемые в той же самой базе. Когда все данные содержатся в едином хранилище, изучение и анализ связей между отдельными элементами могут быть наиболее эффективны. В дальнейшем идея хранилища была развита в понятие корпоративной памяти (corporate memory) [Kühn, Abecker, 1998], которая по аналогии с человеческой памятью позволяет накапливать информацию из предыдущего опыта и якобы избегать повторения ошибок, что является чисто декларативным утверждением.

Корпоративная память (КП) хранит информацию из различных источников предприятия и делает эту информацию доступной специалистам для решения производственных задач.

Примером систем УЗ на основе корпоративной памяти могут служить Organisational Memory Information Systems (OMIS), предназначенные для накопления и управления знаниями предприятия [Gomez-Perez, 2002]. ОМIS часто используют вспомогательные справочные системы, так называемые helpdesk-приложения. Основные функции OMIS:

Сбор и систематическая организация информации

Интеграция с существующими автоматизированными системами

Обеспечение нужной информации по запросу (пассивная форма) и при необходимости (активная форма).

Конечная цель OMIS состоит в обеспечении доступа к знанию всякий раз, когда это необходимо. Для этого OMIS реализуют активный подход к распространению знаний, который не полагается на запросы пользователей, а автоматически обеспечивает полезное для решения задачи знание. Чтобы предотвращать информационную перегрузку, этот подход должен быть совмещен с высокой выборочной оценкой уместности. Законченная система должна действовать как интеллектуальный помощник пользователю.

Б) Порталы знаний и карты знаний

В настоящее время найдено универсальное решение, обеспечивающее доступ к информации в рамках СУЗ — это корпоративные порталы знаний. Корпоративный портал — это система, которая объединяет все имеющиеся у организации информационные ресурсы (приложения, базы и хранилища данных, аналитические системы и пр.) и, используя web-интерфейс, предоставляет пользователям единый защищенный доступ к корпоративной и внешней информации [Collins, 2003].

Рис. 5. Концептуальная схема корпоративного портала

Некоторые полезные свойства порталов, упоминаемые в различных источниках:

систематизизация контента и предоставление удобных средств поиска и навигации,

управление контентом для различных групп сотрудников (управление доступом).

внутрикорпоративный обмен знаниями и совместная работа за счет наличия различных конференций, форумов и единого рабочего пространства,

индивидуальный персонализированный интерфейс,

возможность работы с онтологиями.

Развитие идей применения онтологий для создания и поддержки порталов можно найти в работах [Staab, Maedhe, 2002; Maedhe et al Collins, 2002].

Часто на порталах располагают карты знаний (Рис.6), которые сочетают «большую карту» компании и каталог детальных знаний в визуальной форме. Карта знаний служит навигационным помощником для поиска. Карта знаний описывает источники, потоки и границы знаний организации. Карты знаний могут указывать как на людей, так и на документы и базы данных [Davenport and Prusak, 1998], объединяя ЧТО- , ГДЕ- и КТО- знания.

В результате достигается минимизация объема информации, большая ясность, наглядность и доступность.

Рис. 6. Карта знаний

Заключение

Информационные технологии не решают всех проблем управления знаниями, напротив, они могут породить и дополнительные сложности – при разработке и внедрении. Однако, при умелом использовании, программные средства УЗ могут помочь перевести инфраструктуру знаний компании на новый материально-технологический уровень, и превратить ее в мощный инновационный ресурс.

Мы рассмотрели программные средства, которые могут использоваться для создания СУЗ в произвольной предметной области (Рис.7). Однако почти в любой компании существуют свои программные средства автоматизации. Например, дизайнеры работают в продуктах для обработки изображений, проектировщики в системах автоматизированного проектирования, программисты в средах программирования, менеджеры и бизнес-аналитики в системах организационного моделирования и проектирования.

Рис. 7. Систематизация программных средств для СУЗ

Задача фомирования СУЗ на программном уровне требует укрощения всего «зоопарка» отдельных программных систем и сопряжения их в единую систему, ядром которой является некоторая база знаний. На сегодня не существует единого стандарта на формат такой базы, но основное направление связано, все-таки, с онтологиями и языками их описания.

Не смотря на огромную технологическую сложность современных описанных инструментов, основную трудность формирования СУЗ представляют не внедрение самих программных систем, а этап анализа и формирования целостного взгляда и концептуальной модели поля знаний предприятия. Проведение этого этапа требует информационной зрелости организации при наличии квалифицированных аналитиков, поддержанных и понятых топ-менеджментом компании. Кроме того, психологическое сопротивление сотрудников при внедрении СУЗ также не стоит сбрасывать со счета.

Только учет всех этих факторов может помочь превратить дорогостоящую и трудоемкую СУЗ в эффективный и востребованный современный инструмент просвещенного менеджмента.

Литература

[Ализар, 2006] Ализар А. Веб 2.0 указывает путь к «Предприятию 2.0» // Обзор "Рынок ИТ: Итоги 2006" подготовленный CNews Analytics. http://cnews.ru/reviews/free/2006/articles/web.shtml

[Андреева, Расков, 2006] Андреева Т., Расков В. Создание знаний как условие долгожительства компании. Вестник СПбГУ. Серия Менеджмент. 2006, 3, 140-151

[Бизнес в паутине социальных сетей, 2007] Бизнес в паутине социальных сетей // Инновации в технологиях и бизнесе, №5, 2007. http://www-306.ibm.com/software/ru/mag/5/article.html

[Гаврилова, 2008] Гаврилова Т.А. Модели структурирования и инструменты управления знаниями //Cб. докладов Одиннадцатой научно-практической конференции «Реинжиниринг бизнес-процессов на основе современных информационных технологий. Системы управления знаниями» (РБП-СУЗ-2008). М., 2008. – с.47-50

[Дёрре И. и др., 2007] Дёрре И., Магдален Д., Пос В., Сент-Клер Б. Использование таксономий для корпоративного поиска с помощью программ IBM OmniFind, IBM Classification Module и SchemaLogic //developerWorks Россия, 2007.

Джанетто К., Уилер Э. (2005) Управление знаниями: Руководство по разработке и внедрению корпоративной системы управления знаниями. Изд-во М. Добрая книга., 2005.

[Мильнер, 2003] Мильнер Б.З. Управление знаниями. М. Инфра-М, 2003.

[Мильнер и др., 2006] Мильнер Б. З., Румянцева З. П., Смирнова В. Г., Блинникова А. В. Управление знаниями в корпорациях. Под редакцией Мильнера Б. З, М: «ДЕЛО», 2006.

[Николаев, 1999] Николаев А., Построение систем управления знаниями на базе технологии Documentum 4i // Открытые системы , N9-10.- с.44-48, 1999.

[О’Рейли, 2005] О’Рейли Т. Что такое Веб 2.0 (перевод) // Computerra, 18 октября 2005 года. http://www.computerra.ru/think/234100/

11. [Циперман, 2005] Циперман Г. База знаний IBS // Семинар «Интеллектуальная корпорация», 21 сентября, 2004, Москва, Россия. http://integration.ibs.ru/content/pdf/KBase_IBS.pdf

Abecker, A., D. Apostolou, W. Maas, G. Mentzas, C. Reuschling, S. Tabor Towards an Information Ontology for Knowledge Asset Trading Presented at the ICE 2003 - 9th International Conference of Concurrent Enterprising, Espoo, Finland, 16-18 June 2003.

[Abecker, van Elst, 2003] Abecker A., van Elst L.. Handbook on Ontologies, chapter 22: Ontologies for Knowledge Management, pages 436–454. International Handbooks on Information Systems. Springer Verlag, 2003.

[Богданова Е., 2006] Богданова Е. Интеграционное решение для управления контентом и построение хранилища данных // Конференция IBM по инновациям, 25 мая 2006, Санкт-Петербург.

[Andrews, 2007] Andrews W. Magic Quadrant for Information Access Technology, 2007 // Gartner Research, 5 September 2007.[Berners-Lee, Hendler, 2001] Berners-Lee T., Hendler J., Lassila O. The Semantic Web //Scientific American, May 17, 2001. (перевод Евгения Золина http://ezolin.pisem.net/logic/semantic_web_rus.html)

[Bughin, Manyika, 2007] Bughin J., Manyika J. How businesses are using Web 2.0: A McKinsey Global Survey //McKinsey Quarterly, March, 2007

[Collins, 2003] Collins H. Enterprise Knowledge Portals. AMACOM, 2003’

[Cerebra, 2005] Cerebra, Inc., Enterprise Semantic Web - Understanding the Evolution of Integration Technologies in the Context of the W3C Semantic Web Vision, Whitepaper, 2005.

[Davenport and Prusak, 1998] Davenport Th.H., Prusak L.. Working Knowledge. Harvard Business School Press, Boston, MA, 1998.

[Davies et al, 2005] Davies J, Studer R, Sure Y and Warren P W, Next generation knowledge management // BT Technology Journal. - Vol 23, №3, 2005.

[Dracos, 2007] Dracos N. Collaboration and Social Software // Gartner RAS Core Research, 24 October 2007.

[Gomez-Perez, 2002] Gomez-Perez, Asuncion (Editor), Richard Benjamins (Editor), 2002. Knowledge Engineering and Knowledge Management. Ontologies and the Semantic Web. Springer Verlag.

[van Engers, 2001] Tom Maarten van Engers. Knowledge Management: The Role of Mental Models in Business Systems Design. PhD thesis, Vrije Universiteit, Amsterdam, 2001.

[Haghi, 2005] Haghi G. Knowledge Capture & Reuse (KCR) in HP Global Method for Project Management //International Conference on Knowledge Management, 29 June – 1 July, 2005, Graz, Austria.

[Himma, 2007] Himma K.E. (Editor) Information ethics. Emerald Group Publishing Limited, 2007.

[IBM, 2008 ]http://www.ibm.com/

[IBM OmniFind Enterprise Edition, 2008] Content Discovery Solutions: IBM OmniFind Enterprise Edition: A strategic platform for enterprise search and text analytics // IBM Whitepaper, 2008.

[InterOP, 2004] Ontology-based Services for Enterprise Application Interoperability. State of the Art Reeport. InterOP, 2004.

[Kühn, Abecker, 1998] Kühn O., Abecker A., Corporate Memories for Knowledge Management in Industrial Practice: Prospects and Challenges. 1998.

[Maedhe et al, 2002] Maedche A., Staab S., Studer R., Sure Y., Volz R. SEAL— Tying Up Information Integration and Web Site Management by Ontologies //IEEE Data Engineering Bulletin 25 (1): 10-17. 2002.

[Marwick, 2001] Marwick A.D. Knowledge management technology //IBM Systems Journal, vol. 40, № 4, 2001.

[Mika, Akkermans, 2004] Mika, P., Akkermans H. Towards a New Synthesis of Ontology Technology and Knowledge Management Knowledge // Engineering Review, Cambridge University Press, Volume 19, № 4, 2004.

[Papavassiliou, 2003] Papavassiliou G., Mentzas G. Knowledge modelling in weakly-structured business processes, Journal of knowledge management, VOL. 7 NO. 2 2003, pp.33-43.

[Shegda et al, 2007] Shegda K., Bell T., Chin K., Gilbert M., Magic Quadrant for Enterprise Content Management, 2007 // Gartner RAS Core Research, 21 September 2007.

[Staab, Maedhe, 2002] Staab S., Maedche A. Knowledge Portals: Ontologies at Work. AI Magazine 2001, Vol. 22, №2, p. 63-75.

[Tschaitschian, 1997] Tschaitschian B., Abecker A. and Schmalhofer, 1997. A. Putting Knowledge Into Action: Information Tuning With KARAT. // In 10th European Workshop on Knowledge Acquisition, Modeling, and Management (EKAW-97).

Список литературы

Для подготовки данной применялись материалы сети Интернет из общего доступа