Методика проектирования корпоративного хранилища данных…
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2016. № 4
39
Двухуровневое хранилище данных
подразумевает использование принци-
пов подхода «сверху–вниз», т.
е. создается единое хранилище данных — источ-
ник агрегированных и детальных данных для построения аналитической
отчетности в каждом подразделении. Первый уровень представляется источни-
ками данных, в которые загружаются записи исходных систем с помощью
ETL-процессов. На втором уровне реализуется непосредственно централизо-
ванное хранилище данных, состоящее из одного или нескольких OLAP-кубов,
связанных с источниками данных через систему объектов промежуточного
хранения. Таким образом, все аналитические отчеты пользователей формиру-
ются на основе единственного источника данных. Благодаря следованию прин-
ципам «сверху–вниз» в данном подходе реализуется строгое соответствие дан-
ных документированным стандартам и бизнес-правилам, однако такое пред-
ставление не всегда оказывается удобным для конечных пользователей.
Трехуровневое хранилище
данных также относится к разновидностям под-
хода «сверху–вниз», но при этом устраняется недостаток КХД, состоящего из
двух уровней — появляется поддержка потребностей отдельных подразделений
компании. Первые два уровня структурно повторяют двухуровневое хранили-
ще, однако, появляется третий уровень — витрины данных, которые снабжают
аналитические отчеты отделов предприятия специализированными детальны-
ми данными. При этом источником данных для витрин по-прежнему остается
единое хранилище данных, что гарантирует целостность и непротиворечивость
информации. В этом случае удовлетворяются потребности пользователей, но
возникает избыточность в хранении данных. Следовательно, принципиальные
отличия данной архитектуры от двухуровневой заключаются в том, что появ-
ляются возможности гибкой настройки аналитической отчетности подразделе-
ний, а также распределения нагрузки на систему между витринами данных, что
ранее было невозможно из-за обращения всех запросов к единому источнику.
Подход SAP LSA к проектированию КХД.
Многоуровневая масштабируе-
мая архитектура SAP Layered Scalable Architecture (LSA) — это стандарт проек-
тирования глобальных масштабируемых хранилищ данных, разработанный
компанией SAP для применения в КХД [3, 9]. За основу был взят подход SAP
Enterprise Data Warehouse (EDW — корпоративное хранилище данных), недо-
статки которого — плохая масштабируемость и низкая производительность при
обработке интенсивного потока данных.
Корпоративное хранилище данных, построенное по принципам LSA, со-
стоит из семи уровней (слоев), приведенных на рис. 5. Следует отметить, что в
LSA активно используются объекты хранения Operational Data Store (ODS) —
таблицы базы данных, объединяющие ключевые поля нескольких справочников
и предназначенные для промежуточного хранения данных.
1. Уровень сбора данных (DAL — Data Acquisition Layer), как и в классичес-
ком хранилище данных, используется для передачи информации из системы–
источника.