С.А. Тоноян, В.А. Высочанский
34
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2016. № 4
(экстракторов). Поэтому возникает потребность в подходе, описывающем способ
проектирования унифицированных хранилищ, витрин данных, совокупность ко-
торых объединяется в корпоративное хранилище данных (КХД), обладающее гиб-
кой структурой, и предоставляет пользователям единую OLAP-отчетность.
Корпоративное хранилище данных представляет собой систему обработки
и многомерного анализа оперативных, исторических и прогнозных данных
предприятия на основе системы КПЭ.
Наиболее популярным инструментальным программным средством для ре-
ализации хранилищ данных крупных предприятий является система SAP BW. В
методической литературе, предлагаемой компанией SAP и сторонними автора-
ми, чаще всего описываются принципы построения классических хранилищ
данных, которые частично используются при проектировании КХД на базе
КПЭ. Таким образом, возникает необходимость в методике, учитывающей спе-
цифику КХД и возможности SAP BW при проектировании хранилища данных.
Классическая структура хранилища данных на базе SAP BW.
Неотъемле-
мой чертой любого хранилища данных является наличие средств аналитиче-
ской обработки в реальном времени OLAP, иногда называемых средствами мно-
гомерного анализа. Данные инструменты основаны на концепции многомерной
модели базы данных, позволяющей исключить недостатки использования реля-
ционной базы данных с высокой степенью нормализации, которые задейство-
ваны в OLTP-системах, ориентированных на обработку транзакций в реальном
времени [2, 3]. Платформа SAP BW предоставляет собой широкий набор ин-
струментов OLAP, в основе которых лежит идея построения OLAP-кубов (ин-
фокубов в терминологии SAP).
Связь между OLTP- и OLAP-системами реализуется в виде ETL-процессов
(Extract, Transform, Load — извлечение, преобразование, загрузка), схематиче-
ское изображение которых показано на рис. 1.
Рис. 1.
ETL-процесс
Хранилище данных в SAP BW строится из набора инфокубов. Каждый со-
стоит из одной таблицы фактов и нескольких таблиц измерений. Подобная
структура денормализована и нередко избыточна в целях повышения скорости
выполнения запросов к инфокубам, что достигается при отсутствии необходи-
мости в соединении (JOIN в терминологии SQL) множества таблиц и выполне-
нии специализированных запросов [1, 3]. Непосредственно на OLAP-кубах в
SAP BW строятся аналитические отчеты, являющиеся конечной целью разра-
ботки хранилища данных.