Модифицированный метод классификации многомерных временных рядов…
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 2
47
числения «расстояния» от найденного шейплета до рассматриваемого ряда.
Если оно не превышает некоторого порогового значения, то ряд относят к пер-
вому классу, в противном случае — ко второму. В работе [1] также рассмотрено
расширение метода шейплетов на случай трех и более классов. Для решения
такой задачи предложено использовать дерево решений, в котором каждый узел
дерева представляет собой бинарный шейплет–классификатор.
В работе [2] предложен метод шейплет-преобразования (
англ.
Shapelet trans-
form
), который является дальнейшим развитием исходного варианта метода
шейплетов. Идея метода состоит в том, что в качестве характерных признаков
временного ряда используют расстояния от этого ряда до набора из
k
лучших
шейплетов. Преимуществом данного подхода является возможность примене-
ния к указанным признакам различных методов классификации, не ограничи-
ваясь деревом решений. В той же работе предложено оценивать качество
шейплетов с помощью критерия Фишера (
англ.
Fisher’sratio
), показывающего
отношение межклассовой дисперсии к внутриклассовой.
Существенным недостатком, ограничивающим применение метода
шейплетов, является его высокая вычислительная сложность, связанная с необ-
ходимостью в предельном случае полного перебора всех фрагментов исходных
временных рядов. В публикациях [1, 3] предложены способы сокращения мно-
жества перебираемых вариантов путем отбрасывания кандидатов после пред-
варительной оценки их качества или оценки их близости к уже рассмотренным
фрагментам временных рядов.
В настоящей работе для поиска шейплетов вместо полного перебора фраг-
ментов исходных временных рядов предложено использовать генетический ал-
горитм. Задачу поиска шейплетов рассматриваем как задачу оптимизации, в
которой роль целевой функции играет оценка качества шейплета. Варьируемы-
ми выступают такие параметры шейплета, как индекс исходного временного
ряда, фрагментом которого является шейплет, сдвиг относительно начала вре-
менного ряда и длина шейплета. Также в работе предложен новый способ оцен-
ки качества шейплетов, который заключается в определении точности класси-
фикации, достижимой на векторах расстояний от шейплета до исходных вре-
менных рядов. Эффективность предложенных модификаций метода шейплетов
исследована при анализе электроэнцефалограмм (ЭЭГ), которые получены при
работе пользователей с интерфейсом мозг–компьютер (ИМК) [4]. Выбор этих
данных обусловлен тем, что возможность применения метода шейплетов для
анализа данных в ИМК является в настоящее время малоизученной. Таким об-
разом, результаты исследования представляют самостоятельную ценность.
Постановка задачи классификации многомерных временных рядов с по-
мощью шейплетов.
Временной ряд
— это упорядоченная последовательность
отсчетов
= …
1 2
,
,
, ,
N
X x x x
взятых в моменты времени
(0, 1, ..., ( 1)) ,
t
N t
=
− Δ
где
N
— общее число отсчетов; Δ
t
— интервал дискретизации. Многомерный вре-
менной ряд, содержащий совокупность дискретных отсчетов, полученных по