нормализация вектора
g
и векторов
g
и
T
не влияет на результат. В
целом, несмотря на результаты, гипотезу о преимуществе алгоритма
частотного сравнения следует проверить на б´oльшем объеме данных
и с нелинейными функциями ядра. Для решения задачи сравнения
паттернов следует рассмотреть возможность формирования метагра-
фов во временн´ом и частотном доменах. Также возможно встраивание
частотных значений для фильтрации паттернов и шумов в функцию
J
search
.
Результаты исследования алгоритмов временн´ого и частотного сопоставления
последовательностей
Сравниваемая па-
ра паттернов (см.
рис. 6)
Временной алгоритм
Частотный алгоритм
g g
н
T
(
g
)
T
(
g
н
)
T
н
F
(
g
)
F
(
g
н
)
F
(
T
(
g
))
F
(
T
(
g
н
))
F
(
T
н
)
F
н
(
g
)
F
н
(
T
)
Y
1
−
Y
2
17 0,24 6,3 0,35 33,7 0,31 0,31 8,30 0,0013 0,68 0,11 1,23
Y
2
−
Y
3
10
0,05 0,005 0,14 0,03
0,68
0,25
8,39
0,0003
0,52
0,07 0,47
Y
1
−
Y
3
0,07
0,07 3 0,39 12,7
0,04
1,02
0,80
0,0012
0,07
0,15 0,96
П р и м е ч а н и е. Минимальные значения в столбцах, которые при правильном выборе алгоритма
должны быть в строке
Y
2
−
Y
3
выделены полужирным.
Обучение функций
J
search
и
J
add
. Одним из вариантов определения
пороговых значений и коэффициентов в выражениях (5) и (6), т.е. обу-
чения функции
J
add
, является использование баз последовательностей
изображений, аннотированных экспертами. Среди таких баз следу-
ет выделить базы MMI [12] и CK+ [13]. База MMI содержит 2876
видеоизображений по несколько секунд (
2
. . .
6
00
) с fps = 25 кадр/с
(
50
. . .
150
кадров), на каждом из которых присутствует 1 – 6 из око-
ло 30 паттернов в зависимости от сложности выражения лица. База
CK+ включает в себя приблизительно 700 последовательностей изо-
бражений, в каждой из которых около 20 кадров. Суммарное число
представленных субъектов, выполняющих паттерны, составляет при-
близительно 200 человек.
Часть базы MMI (329 видеоизображений) также имеют покадровые
описания фаз паттернов: нарастание (onset); пик (apex); спад (offset).
Данные материалы могут применяться для обучения функции поиска
границ
J
search
(4).
Реорганизация паттернов.
Под реорганизацией понимается вы-
деление общих паттернов, вычисление новых центров кластеров
μ
jD
q
и пороговых значений
τ
jD
q
, определяющих их границы, в каждом до-
мене (рис. 7). Для разделения паттернов на классы (кластеры) при-
меняются алгоритмы
k
-средних [4] и его нелинейные и взвешенные
расширения [8].
Центр кластера
C
j
в домене
D
q
рассчитывается как паттерн
μ
jD
q
= AU
C
j
, расстояние от которого до других паттернов мини-
мально в пределах кластера:
arg min
AU
C j
dist AU
C
j
, j, D
q
.
Пороговое значение определяется как
τ
jD
q
= 2max
AU
C j
dist AU
C
j
, j, D
q
,
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2014. № 4 49