Д.Е. Супрун
94
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2016. № 5
После определения ключевой точки необходимо установить ее ориентацию,
которую находят исходя из направлений градиентов точек, соседних с ключевой
точкой. Все вычисления градиентов проводят на изображении в пирамиде гаус-
сианов с масштабом, наиболее близким к масштабу ключевой точки. Значение и
направление градиента в точке с координатами (
х
,
у
) рассчитывают по форму-
лам [3]:
2
2
,
1,
1,
,
1
,
1 ;
m x y
L x y L x y
L x y
L x y
1
,
1
,
1
,
tg
,
1,
1,
L x y
L x y
x y
L x y L x y
где
,
m x y
— градиент;
,
x y
— направление градиента.
Для начала необходимо определить окрестность ключевой точки, в которой
будут рассмотрены градиенты. Это будет окрестность, требуемая для свертки с
гауссовым ядром, причем ядро будет круглым и радиус размытия для этого ядра
составит 1,5 (масштаб ключевой точки). Для гауссова ядра действует так
называемое правило трех сигм: значение гауссова ядра очень близко к нулю на
расстоянии, превышающем 3
. Следовательно, радиус окрестности равен 3
.
Направление ключевой точки находят из гистограммы направлений, которая
состоит из 36 компонентов, равномерно покрывающих промежуток в 360°, и
формируется следующим образом: каждая точка окрестности (
х
,
у
) вносит
вклад, равный
, , ,
mG x y
в тот компонент гистограммы, который покрывает
промежуток, содержащий направление градиента
, .
x y
Направление ключе-
вой точки лежит в промежутке, покрываемом максимальным компонентом ги-
стограммы. Значения максимального компонента (max) и двух соседних с ним
интерполируют параболой, и точка максимума этой параболы берется в каче-
стве направления ключевой точки. Если в гистограмме есть еще компоненты, не
меньше 0,8max, то их интерполируют аналогично и приписывают ключевой
точке дополнительные направления [6].
Дескриптором может быть любой объект, но чаще всего им является некото-
рая информация об окрестности ключевой точки. Это связано с тем, что на ма-
ленькие области меньшее влияние оказывают эффекты искажений, некоторые из-
менения (изменение положения объекта на изображении, изменение сцены, пере-
крытие одного объекта другим, поворот) могут не повлиять на дескриптор.
В методе SIFT дескриптор — вектор, который вычисляют на гауссиане,
ближайшем по масштабу к ключевой точке, и исходя из градиентов в некоторой
окрестности ключевой точки. Перед определением дескриптора окрестность
поворачивают на угол направления ключевой точки, за счет чего достигают ин-
вариантность относительно поворота.
Часть изображения (рис. 7,
а
) представлена в виде пикселей, обозначенных
квадратиками. Пиксели берутся из квадратного окна дескриптора, которое в свою
очередь поделено еще на четыре равных части. Стрелочка, которая находится в