Previous Page  5 / 16 Next Page
Information
Show Menu
Previous Page 5 / 16 Next Page
Page Background

Методика проектирования корпоративного хранилища данных…

ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2016. № 4

37

1. Извлечение данных из таблиц OLTP-системы с помощью структур извле-

чения — особых виртуальных таблиц, являющихся проекциями реально суще-

ствующих таблиц базы данных.

2. Преобразование извлеченных данных посредством стандартных опера-

ций (перевод в другой формат) или программ, написанных на встроенном объ-

ектно-ориентированном языке ABAP.

3. Загрузка в хранилище данных.

Требования к проектированию КХД.

Корпоративное хранилище данных,

в отличие от классического, должно содержать данные разной степени агреги-

рования. Это означает, что одна и та же запись, извлеченная из исходной систе-

мы, хранится в КХД на нескольких уровнях:

а) изначальное представление — наиболее детализированная информация;

б) промежуточное представление — данные агрегированы по нескольким

признакам, например: выручка в рублях из сбытовых контрактов суммируется

по странам, т. е. исключается признак «Сбытовой контракт», но остается при-

знак «Страна»;

в) окончательное представление — данные находятся в наиболее обобщен-

ном виде, в котором набор ограничен пятью–десятью измерениями.

Отсюда следует, что для построения КХД недостаточно использовать си-

стему инфокубов, на каждом из которых базируется OLAP-отчет, так как по-

добная схема позволяет хранить данные только на одном уровне детализации.

Следующая особенность КХД — наличие ключевых показателей эффектив-

ности. В отличие от показателей классического хранилища данных, повторяю-

щих показатели исходной системы (суммы, объемы, выручки, расходы, при-

быль и т. п.), КПЭ наиболее точно отражают состояние бизнеса. Очевидно, что

концепция КПЭ подразумевает сложную систему расчета и извлечения данных

(иногда для расчета одного КПЭ требуются данные из разных несвязанных си-

стем), не предоставляемую классическим хранилищем.

Как правило, КХД внедряют достаточно крупные предприятия–учреди-

тели, желающие проводить анализ эффективности работы своих дочерних

предприятий. Отсюда следует, что единое КХД разделяется на «витрины дан-

ных» — небольшие хранилища отдельных дочерних обществ, формирующие

КПЭ в рамках своей деятельности [4, 5]. Часто возникает необходимость во

взаимной интеграции витрин в связи с получением обобщенных КПЭ.

Обязательное наличие оптимизированной структуры хранения архивных

(исторических) данных также отличает КХД от обычного хранилища [6, 7]. Как

правило, в каждой витрине данных создается архивный OLAP-куб, в который

передаются наиболее агрегированные записи (для уменьшения объема хранимой

информации) по закрытым отчетным периодам. В отличие от обычных инфоку-

бов, архивный куб редко используется для построения OLAP-отчетов — его ос-

новной целью является сохранение исторических данных, которые в перспективе

можно использовать для расчета, например, прогнозных значений [2].