Информационно-аналитические системы

We use cookies. Read the Privacy and Cookie Policy

Информационно-аналитические системы

Назначением систем данного класса является обеспечение руководителей, аналитиков и менеджеров информацией о всех аспектах деятельности предприятия для ее последующей оценки и анализа. В состав информационно-аналитической системы (ИАС) обычно включаются следующие подсистемы:

• подсистема сбора и хранения корпоративных данных, решающая задачи по сбору и фильтрации данных, накоплению и индексированию информации, обеспечивающая возможность использования информации в аналитических целях, а также при поддержке принятия решений на различных уровнях управления;

• подсистема доступа к данным, анализа и корпоративной отчетности, включающая модули, обеспечивающие доступ к данным и защиту конфиденциальной информации, инструменты по поддержке принятия решений и оперативному анализу информации, средства корпоративной отчетности и визуализации данных.

Первая подсистема традиционно базируется на технологии оперативной обработки транзакций OLTP (On-Line Transaction Processing). В основе второй лежит технология хранилищ данных (Data Warehousing), содержащих непротиворечивые консолидированные исторические данные предприятия, отражающие его деятельность за достаточно продолжительный период времени, а также данные о внешней среде его функционирования.

Часто, наряду с общим хранилищем данных, предприятия используют киоски/витрины данных (Data Mart), представляющие собой специализированные хранилища данных по конкретному подразделению или аспекту деятельности предприятия. В соответствии с этим хранилище данных может иметь как двухуровневую (источники данных – хранилище данных), так и трехуровневую (источники данных – общее хранилище данных – специализированные хранилища данных) архитектуру.

Важным компонентом ИАС являются средства загрузки данных в хранилище, обеспечивающие очистку данных, полученных из различных источников, а именно:

• устранение избыточности и обнаруженных ошибок;

• обнаружение и разрешение противоречий между данными;

• восполнение пропусков;

• проверку ограничений целостности и устранение их нарушений и т. п.

Анализ данных в хранилищах базируется на технологиях интерактивной аналитической обработки данных OLAP (On-Line Analytical Processing), глубинного анализа данных (Data Mining) и их визуализации.

В основе технологий OLAP лежит многомерное представление данных, обеспечивающее адекватность методов моделирования данных потребностям их анализа. В многомерной модели данные представляются в виде кубов данных (или гиперкубов), имеющих несколько независимых измерений многомерного пространства, при этом каждому измерению соответствует некоторый характеризующий какое-либо качественное свойство данных атрибут – время, территория, категория продукции и т. п. На множестве значений атрибутов могут быть определены иерархические отношения – «год—квартал—месяц», «регион—город—район», «услуга—консалтинг—реинжиниринг». Наборы значений атрибутов определяют ячейки куба, с которыми ассоциируются конкретные значения соответствующих показателей. С использованием такой модели возможен анализ данных с необходимой степенью детализации за счет:

• построения сечения (проекции) куба данных путем фиксации значений наборов атрибутов;

• сжатия куба на основе использования значений атрибутов более высокого уровня иерархии и агрегирования соответствующих значений показателей;

• детализации данных (обратной по отношению к сжатию операции);

• вращения куба путем изменения порядка измерений.

Технологии глубинного анализа данных позволяют их анализировать с помощью математических моделей, основанных на статистических, вероятностных или оптимизационных методах, с целью выявления заранее неизвестных закономерностей или зависимостей. К задачам глубинного анализа относятся задачи классификации, выявления ассоциаций, поиска типовых образцов на заданном множестве, выявления объектов, не соответствующих общим характеристикам, и т. п.

В процессе анализа данных активно используются разнообразные формы их графического представления, облегчающие понимание данных и обеспечивающие возможности качественной оценки их свойств. В случае недостаточности пассивного восприятия применяются операции вращения куба данных, операция пролистывания сечений куба и т. п.

Данный текст является ознакомительным фрагментом.