Оценка времени соединения двух таблиц в параллельной колоночной системе баз данных - page 3

современных колоночных БД [12] значения столбца упорядочиваются
по их позициям.
На логическом уровне колоночное хранилище выглядит идентично
строчному: оно, по существу, представляет собой только модификацию
физической (дисковой) структуры БД. В общем случае колоночные БД
могут реализовывать совместимый со стандартами интерфейс реляци-
онной БД (например, ODBC, JDBC и т.д.). Основные на данном уровне
различия заключаются в информационных процессах, протекающих
при формировании плана запроса и в процессе его выполнения [12].
Использование колоночных СУБД позволяет существенно уменьшить
время реализации запросов к БД [10].
Материализация кортежей
. Одним из процессов при формиро-
вании ответа на запрос в колоночных БД является материализация кор-
тежей — процесс воссоздания кортежа на основе столбцов-атрибутов.
В зависимости от момента применения данной операции в плане за-
проса существуют следующие варианты материализации [13]:
ранняя материализация
. Данный вариант аналогичен “есте-
ственной” материализации, применяемой в строчных хранилищах:
каждый раз, когда осуществляется доступ к новому атрибуту, он до-
бавляется к кортежу;
поздняя материализация
. Специфика колоночных хранилищ по-
зволяет отложить процесс материализации до определенного момента,
используя в процессе выполнения запроса позиции значений в ко-
лонках вместо самих значений атрибутов. К преимуществам данного
метода можно отнести более высокую скорость работы с позициями
значений по сравнению со всем кортежем.
Сжатие данных.
В современных СУБД широко используется сжа-
тие данных. Это позволяет повысить производительность уменьшая
число дисковых операций ввода-вывода и объем передаваемых по
сети данных. Колоночное хранение отношений позволяет улучшить
этот показатель по сравнению со строчными хранилищами. Это дости-
гается путем использования коэффициентов повторяемости значений
атрибутов и возможности оперировать сжатыми данными (т.е. отсут-
ствие затрат на декомпрессию). В работе [14] предлагается получен-
ный эмпирическим путем алгоритм выбора типа компрессии данных в
столбцах.
Параллельная обработка запросов.
Основной формой параллель-
ной обработки запросов является фрагментный параллелизм. Подроб-
но данный процесс рассмотрен в работах [6–9, 15]. В соответствие с
этой схемой запрос на языке SQL преобразуется в некоторый после-
довательный план. Данный последовательный план преобразуется в
параллельный план, представляющий собой совокупность
n
идентич-
ных параллельных агентов, которые реализуют те же операции, что
82 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012. № 4
1,2 4,5,6,7,8,9,10,11,12,13,...20
Powered by FlippingBook