Методика и модель кластеризации паттернов двигательной активности лица как преобразований метаграфов - page 4

тах используются жесткие граничные условия, включая длительность
паттерна, встречаемость паттерна у других людей и др. [8]. При ана-
лизе видеоархивов, снятых не в лабораторных условиях (см. рис. 1),
становится понятно, что с каждым новым видеоматериалом появляют-
ся новые паттерны в связи с индивидуальными особенностями людей
и изменившимся контекстом ситуации.
Поэтому далее для выполнения цели настоящей работы формули-
руются две задачи:
1. Обучение функции поиска и добавления паттерна в кластер.
2. Реорганизация кластеров паттернов.
Отметим, что класс — это тип паттерна, кластер — набор экземпля-
ров паттернов одного класса, т.е. число кластеров равно числу классов,
поэтому в некоторых контекстах понятия “класс” и “кластер” имеют
одинаковый смысл.
Первая задача сводится к задаче обучения бинарной функции до-
бавления нового кластера паттернов
J
add
, которая возвращает 0 в слу-
чае, если паттерн представляет собой разновидность или комбинацию
других, или 1 в случае, если необходимо добавить новый кластер, цен-
тром которого является указанный паттерн. Вне зависимости от этого
значения выполняется реорганизация кластеров, т.е. решается вторая
задача.
Часть баз последовательностей изображений MMI [12] и CK+ [13]
предложено использовать для обучения модели (функций добавления
кластера и их реорганизации), часть — для тестирования модели и
экспериментальной проверки соответствия полученных кластеров пат-
тернам кодировки системы FACS. Также предложно применять базу
видеоматериалов (“База1”), аннотированную с помощью инструмента
автоматизированной обработки видеоизображений [14], для тестиро-
вания других паттернов, не представленных в базах MMI/CK+.
В целом методика объединяет концепцию метаграфа и методы
пространственно-временного и визуального анализа с помощью муль-
тидоменной взаимосвязи и функций оптимизации.
Входные и выходные данные алгоритма формирования ме-
таграфа статического изображения лица.
Входными данными ал-
горитма является
i
-е изображение
I
i
2
R
a
×
b
последовательности
Φ = [I
1
, . . . ,
I
N
]
2
R
a
×
b
×
N
, выходными данными — граф
G
i
=
f
(I
i
)
.
Для кластеризации паттернов поведения лица необходимо най-
ти представление изображения, более устойчивое к искажениям объ-
ектов на нем, чем пиксельное представление. Такое представление
должно быть более компактным:
n < ab
, где
n
— число ненулевых
компонентов представления. Так, в работе [8] в качестве описания
изображения использованы геометрические параметры лица на осно-
ве модели активного представления (AAM) (
n
1
= 8
) и дескриптор
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2014. № 4 37
1,2,3 5,6,7,8,9,10,11,12,13,14,...21
Powered by FlippingBook