Previous Page  9 / 13 Next Page
Information
Show Menu
Previous Page 9 / 13 Next Page
Page Background

Д.Е. Супрун

94

ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2016. № 5

После определения ключевой точки необходимо установить ее ориентацию,

которую находят исходя из направлений градиентов точек, соседних с ключевой

точкой. Все вычисления градиентов проводят на изображении в пирамиде гаус-

сианов с масштабом, наиболее близким к масштабу ключевой точки. Значение и

направление градиента в точке с координатами (

х

,

у

) рассчитывают по форму-

лам [3]:

 

 

 

2

2

,

1,

1,

,

1

,

1 ;

m x y

L x y L x y

L x y

L x y

  

 

 

 

 

1

,

1

,

1

,

tg

,

1,

1,

L x y

L x y

x y

L x y L x y

 

  

  

где

 

,

m x y

— градиент;

 

,

x y

— направление градиента.

Для начала необходимо определить окрестность ключевой точки, в которой

будут рассмотрены градиенты. Это будет окрестность, требуемая для свертки с

гауссовым ядром, причем ядро будет круглым и радиус размытия для этого ядра

составит 1,5 (масштаб ключевой точки). Для гауссова ядра действует так

называемое правило трех сигм: значение гауссова ядра очень близко к нулю на

расстоянии, превышающем 3

. Следовательно, радиус окрестности равен 3

.

Направление ключевой точки находят из гистограммы направлений, которая

состоит из 36 компонентов, равномерно покрывающих промежуток в 360°, и

формируется следующим образом: каждая точка окрестности (

х

,

у

) вносит

вклад, равный

, , ,

mG x y

в тот компонент гистограммы, который покрывает

промежуток, содержащий направление градиента

 

, .

x y

Направление ключе-

вой точки лежит в промежутке, покрываемом максимальным компонентом ги-

стограммы. Значения максимального компонента (max) и двух соседних с ним

интерполируют параболой, и точка максимума этой параболы берется в каче-

стве направления ключевой точки. Если в гистограмме есть еще компоненты, не

меньше 0,8max, то их интерполируют аналогично и приписывают ключевой

точке дополнительные направления [6].

Дескриптором может быть любой объект, но чаще всего им является некото-

рая информация об окрестности ключевой точки. Это связано с тем, что на ма-

ленькие области меньшее влияние оказывают эффекты искажений, некоторые из-

менения (изменение положения объекта на изображении, изменение сцены, пере-

крытие одного объекта другим, поворот) могут не повлиять на дескриптор.

В методе SIFT дескриптор — вектор, который вычисляют на гауссиане,

ближайшем по масштабу к ключевой точке, и исходя из градиентов в некоторой

окрестности ключевой точки. Перед определением дескриптора окрестность

поворачивают на угол направления ключевой точки, за счет чего достигают ин-

вариантность относительно поворота.

Часть изображения (рис. 7,

а

) представлена в виде пикселей, обозначенных

квадратиками. Пиксели берутся из квадратного окна дескриптора, которое в свою

очередь поделено еще на четыре равных части. Стрелочка, которая находится в