46
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 2
УДК 519.6
DOI: 10.18698/0236-3933-2017-2-46-65
МОДИФИЦИРОВАННЫЙ МЕТОД КЛАССИФИКАЦИИ МНОГОМЕРНЫХ
ВРЕМЕННЫХ РЯДОВ С ИСПОЛЬЗОВАНИЕМШЕЙПЛЕТОВ
А.П. Карпенко
1
apkarpenko@bmstu.ruП.И. Сотников
1, 2
sotnikoffp@gmail.com1
МГТУ им. Н.Э. Баумана, Москва, Российская Федерация
2
ЗАО «Информтехника и Связь», Москва, Российская Федерация
Аннотация
Ключевые слова
Рассмотрена классификация многомерных временных
рядов с помощью метода шейплетов. Вместо полного
перебора фрагментов исходных временных рядов для
поиска шейплетов предложено использовать генетиче-
ский алгоритм. Выполнена оценка качества шейплетов
путем определения точности классификации, достижи-
мой на множестве векторов расстояний от кандидата до
исходных временных рядов. Эффективность предло-
женных модификаций метода шейплетов исследована
путем анализа известных электроэнцефалограмм, полу-
ченных при работе пользователей с интерфейсом мозг–
компьютер на основе волны Р300. Результаты исследо-
вания показали, что применение указанных модифика-
ций позволяет сократить почти на 99 % множество
перебора при поиске шейплетов без потери точности
классификации
Многомерный временной ряд,
классификация, шейплет, гене-
тический алгоритм, интерфейс
мозг–компьютер
Поступила в редакцию 16.06.2016
©МГТУ им. Н.Э. Баумана, 2017
Введение.
Во многих областях науки и техники возникают задачи классифика-
ции многомерных временных рядов. Например, такие задачи возникают в про-
цессе машинного распознавания речи, при анализе сейсмологических и метео-
рологических данных, биомедицинских данных, в том числе сигналов электро-
энцефалограмм в нейрокомпьютерном интерфейсе. Одним из сравнительно
новых методов классификации временных рядов является метод шейплетов
(
англ.
shapelets
), основанный на выделении таких фрагментов временного ряда,
которые наилучшим образом отражают свойства одного или нескольких клас-
сов исследуемых временных рядов. К преимуществам шейплетов относят их
способность «подмечать» локальные различия временных рядов и возможность
удобной визуализации выявленных различий.
В исходном варианте метод шейплетов предложен в целях разделения од-
номерных временных рядов на два класса [1]. Для каждого отрезка временного
ряда (кандидата в шейплеты) выполняют оценку его качества путем определе-
ния так называемого информационного дохода (
англ.
Information gain
). В каче-
стве шейплета выбирают кандидата с лучшим значением этой оценки. Решение
о принадлежности временного ряда к одному из классов принимают после вы-