Алгоритм сопоставления изображении по ключевым точкам при масштабируемости и вращении объектов

Д.Е. Супрун

ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2016. № 5

После определения ключевой точки необходимо установить ее ориентацию,

которую находят исходя из направлений градиентов точек, соседних с ключевой

точкой. Все вычисления градиентов проводят на изображении в пирамиде гаус-

сианов с масштабом, наиболее близким к масштабу ключевой точки. Значение и

направление градиента в точке с координатами (

) рассчитывают по форму-

лам [3]:

 



 









 







1 ;

m x y

L x y L x y

L x y



  



 



 



 





 



L x y

x y

L x y L x y



 







  



  





где

 

m x y

— градиент;

 

x y



— направление градиента.

Для начала необходимо определить окрестность ключевой точки, в которой

будут рассмотрены градиенты. Это будет окрестность, требуемая для свертки с

гауссовым ядром, причем ядро будет круглым и радиус размытия для этого ядра



составит 1,5 (масштаб ключевой точки). Для гауссова ядра действует так

называемое правило трех сигм: значение гауссова ядра очень близко к нулю на

расстоянии, превышающем 3



. Следовательно, радиус окрестности равен 3



Направление ключевой точки находят из гистограммы направлений, которая

состоит из 36 компонентов, равномерно покрывающих промежуток в 360°, и

формируется следующим образом: каждая точка окрестности (

) вносит

вклад, равный





, , ,

mG x y



в тот компонент гистограммы, который покрывает

промежуток, содержащий направление градиента

 

, .

x y



Направление ключе-

вой точки лежит в промежутке, покрываемом максимальным компонентом ги-

стограммы. Значения максимального компонента (max) и двух соседних с ним

интерполируют параболой, и точка максимума этой параболы берется в каче-

стве направления ключевой точки. Если в гистограмме есть еще компоненты, не

меньше 0,8max, то их интерполируют аналогично и приписывают ключевой

точке дополнительные направления [6].

Дескриптором может быть любой объект, но чаще всего им является некото-

рая информация об окрестности ключевой точки. Это связано с тем, что на ма-

ленькие области меньшее влияние оказывают эффекты искажений, некоторые из-

менения (изменение положения объекта на изображении, изменение сцены, пере-

крытие одного объекта другим, поворот) могут не повлиять на дескриптор.

В методе SIFT дескриптор — вектор, который вычисляют на гауссиане,

ближайшем по масштабу к ключевой точке, и исходя из градиентов в некоторой

окрестности ключевой точки. Перед определением дескриптора окрестность

поворачивают на угол направления ключевой точки, за счет чего достигают ин-

вариантность относительно поворота.

Часть изображения (рис. 7,

) представлена в виде пикселей, обозначенных

квадратиками. Пиксели берутся из квадратного окна дескриптора, которое в свою

очередь поделено еще на четыре равных части. Стрелочка, которая находится в