Алгоритм сопоставления изображений по ключевым точкам…
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2016. № 5
89
диенты изображения при выбранном масштабе в области каждой ключевой точ-
ки. Их преобразуют в представление, которое позволяет на важных уровнях
искажать локальную форму и изменять освещенность. Этот подход называют
масштабно-инвариантным преобразованием характеристик (SIFT), так как он
преобразует данные изображения в масштабно-инвариантные координаты в
соответствии с локальными характеристиками. Важный аспект этого подхода
состоит в том, что он генерирует большое число функций, которые плотно по-
крывают изображение по всему диапазону масштабов и координат. Обычное
изображение размером 500×500 пикселей включает в себя около 2000 устойчивых
характеристик, хотя это число зависит как от контента изображения, так и от вы-
бора различных параметров. Число характеристик, в частности, важно для распо-
знавания объектов, когда возможность определения маленьких объектов из бес-
порядочных фонов требует, чтобы с каждого объекта были правильно подобраны
по крайней мере три функции для надежной идентификации [6].
Для сравнения и распознавания изображений сначала загружают SIFT-
характеристики из набора соответствующих изображений и сохраняют их в базе
данных. Каждую характеристику нового изображения сравнивают с характери-
стиками изображения из предыдущей базы данных, и находят общие сравни-
тельные характеристики на основе евклидова расстояния вектора характери-
стик. Дескрипторы ключевых точек имеют сильные отличительные особенно-
сти, которые позволяют любой характеристике с высокой долей вероятности
найти соответствие в большой базе данных. Однако на изображении с шумами
большинство фоновых характеристик не найдут соответствие в базе данных,
увеличивая вероятность ложных соответствий. Верные соответствия могут быть
отсортированы из всего набора соответствий путем определения подмножества
ключевых точек, которые согласованы с объектом и его местонахождением,
масштабом и ориентацией. Каждая такая группа, состоящая из трех или более
характеристик и согласованная с объектом и его позицией, является предметом
детальной проверки. Устанавливают любые другие характеристики, соответ-
ствующие этой позиции, а несоответствующие отбрасывают. Выполняют де-
тальный расчет вероятности, что данный набор характеристик определяет при-
сутствие объекта, точность сравнения и число возможно неверных соответ-
ствий. Полагают, что сравнительные характеристики объектов, прошедших эти
проверки, с высокой степенью точности являются верными.
На основе анализа метода сопоставления изображений по ключевым точ-
кам предложен детальный алгоритм (рис. 3), на каждом этапе которого суще-
ствуют проблемы, решаемые различными методами.
Для нахождения ключевых точек и их дескрипторов рассмотрим метод
SIFT, в основе которого лежит многомасштабное представление изображений
(рис. 4).
Основной момент при нахождении ключевых точек — построение пирами-
ды гауссианов (Gaussian) и пирамиды разностей гауссианов (Difference of
Gaussian, DoG).