Исследовательский комплекс частотно-временного анализа речевого сигнала с использованием вейвлет-технологии - page 1

ИНФОРМАТИКА И ВЫЧИСЛИТЕЛЬНАЯ
ТЕХНИКА
УДК 621.391.23
Ю. Г. Г о р ш к о в
ИССЛЕДОВАТЕЛЬСКИЙ КОМПЛЕКС
ЧАСТОТНО-ВРЕМЕННОГО АНАЛИЗА
РЕЧЕВОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ
ВЕЙВЛЕТ-ТЕХНОЛОГИИ
Рассмотрены недостатки распространенных аппаратно-прог-
раммных средств анализа речи, используемых при экспертизе фо-
нограмм. Представлена структура исследовательского комплекса
частотно-временного анализа речевого сигнала, обеспечивающего
повышенную точность обработки речевой информации с исполь-
зованием вейвлет-технологии. Приведены экспериментальные дан-
ные построения вейвлет-сонограмм гласных и согласных звуков.
E-mail:
Ключевые слова
:
речевой сигнал, частотно-временной анализ, вейвлет-
преобразование.
В последние годы анализ аудиозаписей звуковой или речевой ин-
формации находит все большее применение как в государственных
экспертных учреждениях [1], так и в частных охранных структурах.
Широкое применение малогабаритных средств регистрации, позволя-
ющих осуществлять цифровую запись речевой информации в сложной
акустической обстановке, в том числе в условиях противодействия
звукозаписи, определяет задачи высокоточного анализа и очистки ре-
чевого сигнала от шумов и помех как наиболее актуальные [2].
Надежность систем распознавания слитной устной речи и иден-
тификации диктора по голосу также зависит от точности методов и
алгоритмов выделения информационных параметров речи при ста-
тистической обработке акустических сигналов. Достаточно сложной
задачей является поиск объективных характеристик физиологических
закономерностей образования звуков в различных языках, определяе-
мых общими принципами формирования речевого звучания, для кото-
рых первичным является наличие около 50 звуков речи, разделяемых
на гласные и согласные.
Большинство современных методов анализа звуков речи основаны
на спектральной модели стационарного сигнала [3]. Недостатком этой
модели является отсутствие вероятностных характеристик для основ-
ных шумовых составляющих в произносимых согласных, и это при
78 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2011. № 3
1 2,3,4,5,6,7,8,9,10
Powered by FlippingBook