Background Image
Previous Page  5 / 13 Next Page
Information
Show Menu
Previous Page 5 / 13 Next Page
Page Background

вания — преобразование Фурье, преобразование на основе полиномов

Чебышева, вейвлет-преобразование, преобразование амплитуд границ.

Звук — сложный тип данных, поэтому эффективное численное

представление звука часто требует большого числа параметров. Тем

не менее, так как набор двухмерных числовых дескрипторов, получен-

ных из каждой спектрограммы, является большим и полным, можно

полагать, что не все из них одинаково информативны для анализа

речевых отрезков.

Для оценки информативности дескрипторов каждому из них ста-

вится в соответствие значение дискриминанта Фишера

W

f

=

N

X

c

=1

(

T

f

T

f,c

)

2

N

X

c

=1

σ

2

f,c

,

(1)

где

N

— число рассматриваемых временн ´ых интервалов;

T

f

— среднее

значение числового дескриптора

f

во всем наборе входных данных;

T

f,c

и

σ

2

f,c

— среднее значение и среднеквадратическое отклонение зна-

чения дескриптора

f

среди обучающего набора спектрограмм в пре-

делах одного временн´ого периода

c

. Все переменные в выражении (1)

вычисляются после того, как значения числовых дескрипторов

f

нор-

мализованы к интервалу [0, 1]. Когда каждому дескриптору поставлено

в соответствие значение дискриминанта Фишера, 65% дескрипторов с

самыми малыми значениями дискриминанта Фишера отбрасываются.

В результате получается набор из 154 числовых дескрипторов. В на-

стоящей работе оптимальное значение порога 65% было получено

эмпирическим путем.

После вычисления вектора свойств дистанция

d

x,c

между аудио-

фрагментом

x

и конкретным временн ´ым интервалом

c

рассчитывается

по выражению

d

x,c

=

X

t

T

c

|

x

|

X

f

=1

W

f

(

x

f

t

f

)

2

p

|

T

c

|

,

где

T

c

— обучающий набор для конкретного временн´ого интервала

c

;

t

— вектор дескрипторов из набора

T

c

;

|

x

|

— длина вектора де-

скриптора

x

;

x

f

— значение числового дескриптора

f

в векторе

x

f

;

t

f

— значение дескриптора

f

изображения

t

из обучающего набора;

|

T

c

|

— число изображений в обучающем наборе периода

c

;

p

— пока-

затель степени,

p

=

5

(это значение было подобрано эмпирическим

путем). Дистанция между вектором дескрипторов конкретной спек-

ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2015. № 3 131