Оперативный и интеллектуальный анализ
Содержание
1. Аспекты проблемы анализа. Классификация методов
2. Типы многомерных OLAPсистем
Аспекты проблемы анализа.
Классификация методов анализа.
Аспекты проблемы анализа. Вся проблема аналитической подготовки принятия решений имеет три аспекта:
•сбор и хранение необходимой для принятия решений информации;
•собственно анализ, в том числе оперативный и интеллектуальный;
•подготовка результатов оперативного и интеллектуального анализа для эффективного их восприятия потребителями и принятия на её основе адекватных решений.
Аспект, касающийся сбора и хранения информации с сопутствующей доработкой, оформился в концепцию информационных хранилищ ( Data Warehouse ).
В связи с большим объёмом и сложностью аспект проблемы собственно анализа имеет два направления - оперативный анализ данных (информации), широко распространена англоязычная аббревиатура названия - On - Line Analytical Processing - OLAP . Основной задачей оперативного или OLAP -анализа является быстрое (в пределах секунд) извлечение необходимой аналитику или ЛПР для обоснования или принятия решения информации.
Интеллектуальный анализ информации – имеет также широко распространённое в русской специальной литературе англоязычное название Data mining . Предназначен для фундаментального исследования проблем в той или иной предметной области. Требования по времени менее жёстки, но используются более сложные методики. Ставятся, как правило, задачи и получают результаты стратегического значения.
Жёстких границ между OLAP и интеллектуальным анализом нет, но при решении сложных задач приходится использовать весьма мощные специальные программные средства или, как говорят, инструменты.
Классификация методов анализа. Существует большое количество методов анализа, которые делятся на группы по различным признакам.
Рассмотрим систему признаков, характеризующих методы анализа. Их можно сгруппировать:
По целям - это:
- оценка состояния и результатов деятельности предприятия;
- постоянный контроль рациональности ведения хозяйственной деятельности, выявление резервов для обеспечения выполнения поставленных задач;
- прогнозирование хода внутренних процессов на предприятии и внешних факторов, влияющих на его деятельность.
По временному фактору анализ разделяют на:
- использующий прошлую информацию, отражённую в документации и на различных носителях и содержащуюся в информационной системе - анализ фактов;
- на базе как прошлой, так и обращённой в будущее, то есть прогнозной информации - анализ событий и отклонений;
- анализ будущей информации - по существу оценка бюджетов и планов, их альтернатив.
По масштабности решаемых или обслуживаемых задач:
- стратегический, сюда можно отнести оценку эффективности целей, долгосрочные прогнозы, исторические оценки процессов и явлений и т.д.;
- оперативный - это оценка текущего состояния, выявление узких мест и отклонений;
- система раннего предупреждения.
По предметным областям:
- в маркетинге;
- производственной или основной деятельности;
- в логистике;
- обеспечении ресурсами;
- финансовой;
- в сфере инвестиций и инноваций.
По методам различают:
- сравнительный по подразделениям, предприятиям, регионам, временным периодам и т.д.;
- анализ отклонений;
- функционально-стоимостный;
- анализ цепочки создания стоимости и конкурентный анализ по Портеру;
- анализ полей бизнеса (Profit Impact of Market Strategies - PIMS);
- бенчмаркинг (Beanchmarking );
- интеллектуальный анализ (Data mining).
2. Типы многомерных OLAP-систем
В рамках OLAP -технологий на основе того, что многомерное представление данных может быть организовано как средствами реляционных СУБД, так многомерных специализированных средств, различают три типа многомерных OLAP -систем:
- многомерный (Multidimensional) OLAP- MOLAP
-реляционный (Relation) OLAP - ROLAP
-смешанный или гибридный ( Hibrid ) OLAP - HOLAP
Выше по существу изложены существо и различия между многомерной и реляционной моделью OLAP -систем. Сущность смешанной OLAP -системы заключается в возможности использования многомерного и реляционного подхода в зависимости от ситуации: размерности информационных массивов, их структуры, частности обращений к тем или иным записям, вида запросов и т.д.
Рассмотрим подробнее достоинства и недостатки приведённых разновидностей OLAP -систем.
Многомерные OLAP -системы
В многомерных СУБД данные организованы не в виде реляционных таблиц, а упорядоченных многомерных массивов или гиперкубов, когда все хранимые данные должны иметь одинаковую размерность, что означает необходимость образовывать максимально полный базис измерений. Данные могут быть организованы в виде поликубов , в этом варианте значения каждого показателя хранятся с собственным набором измерений, обработка данных производится собственным инструментом системы.
Достоинствами MOLAP являются:
- более быстрое, чем при ROLAP получение ответов на запросы -затрачиваемое время на один-два порядка меньше;
- из-за ограничений SQL затрудняется реализация многих встроенных функций.
К ограничениям MOLAP относятся:
- сравнительно небольшие размеры баз данных - предел десятки Гигабайт;
- за счёт денормализации и предварительной агрегации многомерные массивы используют в 2,5-100 раз больше памяти, чем исходные данные;
- отсутствуют стандарты на интерфейс и средства манипулирования данными;
- имеются ограничения при загрузке данных.
Реляционные OLAP -системы
В настоящее время в массовых средствах, обеспечивающих аналитическую работу, преобладает использование инструментов на основе реляционного подхода.
Достоинствами ROLAP- систем являются:
- возможность оперативного анализа непосредственно содержащихся в хранилище данных, так как большинство исходных баз данных реляционного типа;
- при переменной размерности задачи выигрывают ROLAP , так как не требуется физическая реорганизация базы данных;
- ROLAP - системы могут использовать менее мощные клиентские станции и серверы, причём на серверы ложится основная нагрузка по обработке сложных SQL -запросов;
- уровень защиты информации и разграничения прав доступа в реляционных СУБД несравненно выше, чем в многомерных.
Недостатком ROLAP - систем является меньшая производительность, необходимость тщательной проработки схем базы данных, специальная настройка индексов, анализ статистики запросов и учёт выводов анализа при доработках схем баз данных, что приводит к значительным дополнительным трудозатратам.
Выполнение же этих условий позволяет при использовании ROLAP -систем добиться схожих с MOLAP -системами показателей в отношении времени доступа и даже превзойти в экономии памяти.
Гибридные OLAP -системы
Представляют собой сочетание инструментов, реализующих реляционную и многомерную модель данных. При таком подходе используются достоинства первых двух подходов и компенсируются их недостатки. В наиболее развитых программных продуктах такого назначения реализован именно этот принцип.
Использование гибридной архитектуры в OLAP -системах - это наиболее приемлемый путь решения проблем в применении программных инструментальных средств в многомерном анализе.
Список используемой литературы
1.www.market-pages.ru;
2. www.itpedia.ru;
3. www.bizstud.ru.