вания — преобразование Фурье, преобразование на основе полиномов
Чебышева, вейвлет-преобразование, преобразование амплитуд границ.
Звук — сложный тип данных, поэтому эффективное численное
представление звука часто требует большого числа параметров. Тем
не менее, так как набор двухмерных числовых дескрипторов, получен-
ных из каждой спектрограммы, является большим и полным, можно
полагать, что не все из них одинаково информативны для анализа
речевых отрезков.
Для оценки информативности дескрипторов каждому из них ста-
вится в соответствие значение дискриминанта Фишера
W
f
=
N
X
c
=1
(
T
f
−
T
f,c
)
2
N
X
c
=1
σ
2
f,c
,
(1)
где
N
— число рассматриваемых временн ´ых интервалов;
T
f
— среднее
значение числового дескриптора
f
во всем наборе входных данных;
T
f,c
и
σ
2
f,c
— среднее значение и среднеквадратическое отклонение зна-
чения дескриптора
f
среди обучающего набора спектрограмм в пре-
делах одного временн´ого периода
c
. Все переменные в выражении (1)
вычисляются после того, как значения числовых дескрипторов
f
нор-
мализованы к интервалу [0, 1]. Когда каждому дескриптору поставлено
в соответствие значение дискриминанта Фишера, 65% дескрипторов с
самыми малыми значениями дискриминанта Фишера отбрасываются.
В результате получается набор из 154 числовых дескрипторов. В на-
стоящей работе оптимальное значение порога 65% было получено
эмпирическим путем.
После вычисления вектора свойств дистанция
d
x,c
между аудио-
фрагментом
x
и конкретным временн ´ым интервалом
c
рассчитывается
по выражению
d
x,c
=
X
t
∈
T
c
|
x
|
X
f
=1
W
f
(
x
f
−
t
f
)
2
p
|
T
c
|
,
где
T
c
— обучающий набор для конкретного временн´ого интервала
c
;
t
— вектор дескрипторов из набора
T
c
;
|
x
|
— длина вектора де-
скриптора
x
;
x
f
— значение числового дескриптора
f
в векторе
x
f
;
t
f
— значение дескриптора
f
изображения
t
из обучающего набора;
|
T
c
|
— число изображений в обучающем наборе периода
c
;
p
— пока-
затель степени,
p
=
−
5
(это значение было подобрано эмпирическим
путем). Дистанция между вектором дескрипторов конкретной спек-
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2015. № 3 131