качестве основыдля извлечения характеристических признаков гово-
рящего человека из речевого сигнала использование вейвлет базисов
представляется более эффективным. В настоящей работе рассмотре-
нытри варианта использования вейвлет-преобразований в модуле из-
влечения характеристических признаков речи системыраспознавания
голоса диктора. Проведено сравнение производительности подобных
систем с классическими системами, использующими преобразование
Фурье.
Основныепонятия.
Преобразование Фурье
управляет линейной
инвариантной во времени обработкой сигнала
f
, так как синусоидаль-
ные волны
e
iwt
— это собственные функции инвариантных во времени
операторов. Линейный инвариантный во времени оператор
L
полно-
стью определяется собственным числом
ˆ
h
(
w
)
:
∀
ω
∈
R, Le
iwt
= ˆ
h
(
w
)
e
iwt
.
(1)
Чтобывычислить
Lf
, представляем сигнал
f
в виде суммысину-
соидальных собственных функций
{
e
iwt
}
w
∈
R
:
f
(
t
) =
1
2
π
+
∞
−∞
ˆ
f
(
ω
)
e
iwt
dω.
(2)
Если
f
обладает конечной энергией, то амплитуда
ˆ
f
(
ω
)
каждой
синусоидальной волныесть преобразование Фурье
f
:
ˆ
f
(
ω
) =
+
∞
−∞
ˆ
f
(
t
)
e
−
iwt
dt.
(3)
Применяя оператор
L
к
f
в формуле (2) и подставляя выражение
(1) для собственной функции, получаем
Lf
(
t
) =
1
2
π
+
∞
−∞
ˆ
f
(
ω
) ˆ
h
(
ω
)
e
iwt
dω.
(4)
Оператор
L
увеличивает или уменьшает каждую синусоидальную
компоненту
e
iwt
функции
f
на множитель
ˆ
h
(
ω
)
. В этом и состоит
частотная фильтрация
f
.
Принцип неопределенности устанавливает, что энергетическая
протяженность функции и преобразование Фурье не могут быть од-
новременно малыми. В работе [1] элементарные частотно-временные
атомыопределеныкак волновые образования, имеющие минималь-
ную протяженность на частотно-временн´ой плоскости. Разложение
сигнала по этим элементарным атомным образованиям позволяет
получить содержание частотно-временн´ой “информации” в анали-
зируемом сигнале. АтомыГабора построеныс помощью сдвига по
104 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2008. № 3