Previous Page  2 / 20 Next Page
Information
Show Menu
Previous Page 2 / 20 Next Page
Page Background

Модифицированный метод классификации многомерных временных рядов…

ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 2

47

числения «расстояния» от найденного шейплета до рассматриваемого ряда.

Если оно не превышает некоторого порогового значения, то ряд относят к пер-

вому классу, в противном случае — ко второму. В работе [1] также рассмотрено

расширение метода шейплетов на случай трех и более классов. Для решения

такой задачи предложено использовать дерево решений, в котором каждый узел

дерева представляет собой бинарный шейплет–классификатор.

В работе [2] предложен метод шейплет-преобразования (

англ.

Shapelet trans-

form

), который является дальнейшим развитием исходного варианта метода

шейплетов. Идея метода состоит в том, что в качестве характерных признаков

временного ряда используют расстояния от этого ряда до набора из

k

лучших

шейплетов. Преимуществом данного подхода является возможность примене-

ния к указанным признакам различных методов классификации, не ограничи-

ваясь деревом решений. В той же работе предложено оценивать качество

шейплетов с помощью критерия Фишера (

англ.

Fisher’sratio

), показывающего

отношение межклассовой дисперсии к внутриклассовой.

Существенным недостатком, ограничивающим применение метода

шейплетов, является его высокая вычислительная сложность, связанная с необ-

ходимостью в предельном случае полного перебора всех фрагментов исходных

временных рядов. В публикациях [1, 3] предложены способы сокращения мно-

жества перебираемых вариантов путем отбрасывания кандидатов после пред-

варительной оценки их качества или оценки их близости к уже рассмотренным

фрагментам временных рядов.

В настоящей работе для поиска шейплетов вместо полного перебора фраг-

ментов исходных временных рядов предложено использовать генетический ал-

горитм. Задачу поиска шейплетов рассматриваем как задачу оптимизации, в

которой роль целевой функции играет оценка качества шейплета. Варьируемы-

ми выступают такие параметры шейплета, как индекс исходного временного

ряда, фрагментом которого является шейплет, сдвиг относительно начала вре-

менного ряда и длина шейплета. Также в работе предложен новый способ оцен-

ки качества шейплетов, который заключается в определении точности класси-

фикации, достижимой на векторах расстояний от шейплета до исходных вре-

менных рядов. Эффективность предложенных модификаций метода шейплетов

исследована при анализе электроэнцефалограмм (ЭЭГ), которые получены при

работе пользователей с интерфейсом мозг–компьютер (ИМК) [4]. Выбор этих

данных обусловлен тем, что возможность применения метода шейплетов для

анализа данных в ИМК является в настоящее время малоизученной. Таким об-

разом, результаты исследования представляют самостоятельную ценность.

Постановка задачи классификации многомерных временных рядов с по-

мощью шейплетов.

Временной ряд

— это упорядоченная последовательность

отсчетов

= …

1 2

,

,

, ,

N

X x x x

взятых в моменты времени

(0, 1, ..., ( 1)) ,

t

N t

=

− Δ

где

N

— общее число отсчетов; Δ

t

— интервал дискретизации. Многомерный вре-

менной ряд, содержащий совокупность дискретных отсчетов, полученных по