Информационно-аналитические системы
Информационно-аналитические системы
Назначением систем данного класса является обеспечение руководителей, аналитиков и менеджеров информацией о всех аспектах деятельности предприятия для ее последующей оценки и анализа. В состав информационно-аналитической системы (ИАС) обычно включаются следующие подсистемы:
• подсистема сбора и хранения корпоративных данных, решающая задачи по сбору и фильтрации данных, накоплению и индексированию информации, обеспечивающая возможность использования информации в аналитических целях, а также при поддержке принятия решений на различных уровнях управления;
• подсистема доступа к данным, анализа и корпоративной отчетности, включающая модули, обеспечивающие доступ к данным и защиту конфиденциальной информации, инструменты по поддержке принятия решений и оперативному анализу информации, средства корпоративной отчетности и визуализации данных.
Первая подсистема традиционно базируется на технологии оперативной обработки транзакций OLTP (On-Line Transaction Processing). В основе второй лежит технология хранилищ данных (Data Warehousing), содержащих непротиворечивые консолидированные исторические данные предприятия, отражающие его деятельность за достаточно продолжительный период времени, а также данные о внешней среде его функционирования.
Часто, наряду с общим хранилищем данных, предприятия используют киоски/витрины данных (Data Mart), представляющие собой специализированные хранилища данных по конкретному подразделению или аспекту деятельности предприятия. В соответствии с этим хранилище данных может иметь как двухуровневую (источники данных – хранилище данных), так и трехуровневую (источники данных – общее хранилище данных – специализированные хранилища данных) архитектуру.
Важным компонентом ИАС являются средства загрузки данных в хранилище, обеспечивающие очистку данных, полученных из различных источников, а именно:
• устранение избыточности и обнаруженных ошибок;
• обнаружение и разрешение противоречий между данными;
• восполнение пропусков;
• проверку ограничений целостности и устранение их нарушений и т. п.
Анализ данных в хранилищах базируется на технологиях интерактивной аналитической обработки данных OLAP (On-Line Analytical Processing), глубинного анализа данных (Data Mining) и их визуализации.
В основе технологий OLAP лежит многомерное представление данных, обеспечивающее адекватность методов моделирования данных потребностям их анализа. В многомерной модели данные представляются в виде кубов данных (или гиперкубов), имеющих несколько независимых измерений многомерного пространства, при этом каждому измерению соответствует некоторый характеризующий какое-либо качественное свойство данных атрибут – время, территория, категория продукции и т. п. На множестве значений атрибутов могут быть определены иерархические отношения – «год—квартал—месяц», «регион—город—район», «услуга—консалтинг—реинжиниринг». Наборы значений атрибутов определяют ячейки куба, с которыми ассоциируются конкретные значения соответствующих показателей. С использованием такой модели возможен анализ данных с необходимой степенью детализации за счет:
• построения сечения (проекции) куба данных путем фиксации значений наборов атрибутов;
• сжатия куба на основе использования значений атрибутов более высокого уровня иерархии и агрегирования соответствующих значений показателей;
• детализации данных (обратной по отношению к сжатию операции);
• вращения куба путем изменения порядка измерений.
Технологии глубинного анализа данных позволяют их анализировать с помощью математических моделей, основанных на статистических, вероятностных или оптимизационных методах, с целью выявления заранее неизвестных закономерностей или зависимостей. К задачам глубинного анализа относятся задачи классификации, выявления ассоциаций, поиска типовых образцов на заданном множестве, выявления объектов, не соответствующих общим характеристикам, и т. п.
В процессе анализа данных активно используются разнообразные формы их графического представления, облегчающие понимание данных и обеспечивающие возможности качественной оценки их свойств. В случае недостаточности пассивного восприятия применяются операции вращения куба данных, операция пролистывания сечений куба и т. п.
Данный текст является ознакомительным фрагментом.