Методика проектирования корпоративного хранилища данных…
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2016. № 4
37
1. Извлечение данных из таблиц OLTP-системы с помощью структур извле-
чения — особых виртуальных таблиц, являющихся проекциями реально суще-
ствующих таблиц базы данных.
2. Преобразование извлеченных данных посредством стандартных опера-
ций (перевод в другой формат) или программ, написанных на встроенном объ-
ектно-ориентированном языке ABAP.
3. Загрузка в хранилище данных.
Требования к проектированию КХД.
Корпоративное хранилище данных,
в отличие от классического, должно содержать данные разной степени агреги-
рования. Это означает, что одна и та же запись, извлеченная из исходной систе-
мы, хранится в КХД на нескольких уровнях:
а) изначальное представление — наиболее детализированная информация;
б) промежуточное представление — данные агрегированы по нескольким
признакам, например: выручка в рублях из сбытовых контрактов суммируется
по странам, т. е. исключается признак «Сбытовой контракт», но остается при-
знак «Страна»;
в) окончательное представление — данные находятся в наиболее обобщен-
ном виде, в котором набор ограничен пятью–десятью измерениями.
Отсюда следует, что для построения КХД недостаточно использовать си-
стему инфокубов, на каждом из которых базируется OLAP-отчет, так как по-
добная схема позволяет хранить данные только на одном уровне детализации.
Следующая особенность КХД — наличие ключевых показателей эффектив-
ности. В отличие от показателей классического хранилища данных, повторяю-
щих показатели исходной системы (суммы, объемы, выручки, расходы, при-
быль и т. п.), КПЭ наиболее точно отражают состояние бизнеса. Очевидно, что
концепция КПЭ подразумевает сложную систему расчета и извлечения данных
(иногда для расчета одного КПЭ требуются данные из разных несвязанных си-
стем), не предоставляемую классическим хранилищем.
Как правило, КХД внедряют достаточно крупные предприятия–учреди-
тели, желающие проводить анализ эффективности работы своих дочерних
предприятий. Отсюда следует, что единое КХД разделяется на «витрины дан-
ных» — небольшие хранилища отдельных дочерних обществ, формирующие
КПЭ в рамках своей деятельности [4, 5]. Часто возникает необходимость во
взаимной интеграции витрин в связи с получением обобщенных КПЭ.
Обязательное наличие оптимизированной структуры хранения архивных
(исторических) данных также отличает КХД от обычного хранилища [6, 7]. Как
правило, в каждой витрине данных создается архивный OLAP-куб, в который
передаются наиболее агрегированные записи (для уменьшения объема хранимой
информации) по закрытым отчетным периодам. В отличие от обычных инфоку-
бов, архивный куб редко используется для построения OLAP-отчетов — его ос-
новной целью является сохранение исторических данных, которые в перспективе
можно использовать для расчета, например, прогнозных значений [2].