А.П. Карпенко, П.И. Сотников
52
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2017. № 2
(
)
(
)
= …
′
=′
[1,
,
]
,
max
,
,
i
i
i
M
dist
d S S
S S
(4)
где
(
)
,
i i
d S S
′
— расстояния между соответствующими измерениями фрагментов
S
,
S
'.
С учетом алгоритма
ComputeThreshold
процедура
GenerateCandidates
базово-
го алгоритма
Brute-Force
приобретает следующий вид:
pool
←∅
p const
←
Q const
←
(
)
←
Ω, , ,
ComputeThreshold l p Q
1
i
←
while
i P
≤
1
j
←
while
j N l
< −
(
)
←
, ,
S getCandidate i j l
D
←∅
for each
′
S
in
pool
(
)
, '
D D dist S S
← ∪
end for
if
d D d
∀ ∈
pool
pool S
← ∪
end if
1
j
j
← +
end while
1
i
i
← +
end while
return
pool
В процессе формирования списка кандидатов
pool
из исходного набора
данных
Ω
выделяем все возможные фрагменты длины
l
. Для каждого такого
фрагмента
S
оцениваем расстояние от этого фрагмента до всех кандидатов, уже
вошедших в список
pool
. Если рассматриваемый фрагмент
S
удален от всех
кандидатов на расстояние, превышающее значение порога
, то включаем его в
список
pool
. В противном случае, фрагмент
S
отбрасываем.
В методе шейплет-преобразования выбор числа шейплетов представляет
собой самостоятельную задачу. Использование малого числа шейплетов в набо-
ре может не дать достаточной информации для точного разделения классов, а
применение большого числа шейплетов может привести к переобучению алго-
ритма классификации и ослабить влияние важных признаков рассматриваемых
временных рядов на результат классификации. В оригинальном методе