Исследовательский комплекс частотно-временного анализа речевого сигнала с использованием вейвлет-технологии - page 1

ИНФОРМАТИКА И ВЫЧИСЛИТЕЛЬНАЯ

ТЕХНИКА

УДК 621.391.23

Ю. Г. Г о р ш к о в

ИССЛЕДОВАТЕЛЬСКИЙ КОМПЛЕКС

ЧАСТОТНО-ВРЕМЕННОГО АНАЛИЗА

РЕЧЕВОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ

ВЕЙВЛЕТ-ТЕХНОЛОГИИ

Рассмотрены недостатки распространенных аппаратно-прог-

раммных средств анализа речи, используемых при экспертизе фо-

нограмм. Представлена структура исследовательского комплекса

частотно-временного анализа речевого сигнала, обеспечивающего

повышенную точность обработки речевой информации с исполь-

зованием вейвлет-технологии. Приведены экспериментальные дан-

ные построения вейвлет-сонограмм гласных и согласных звуков.

E-mail:

ygorshkov@rambler.ru

Ключевые слова

речевой сигнал, частотно-временной анализ, вейвлет-

преобразование.

В последние годы анализ аудиозаписей звуковой или речевой ин-

формации находит все большее применение как в государственных

экспертных учреждениях [1], так и в частных охранных структурах.

Широкое применение малогабаритных средств регистрации, позволя-

ющих осуществлять цифровую запись речевой информации в сложной

акустической обстановке, в том числе в условиях противодействия

звукозаписи, определяет задачи высокоточного анализа и очистки ре-

чевого сигнала от шумов и помех как наиболее актуальные [2].

Надежность систем распознавания слитной устной речи и иден-

тификации диктора по голосу также зависит от точности методов и

алгоритмов выделения информационных параметров речи при ста-

тистической обработке акустических сигналов. Достаточно сложной

задачей является поиск объективных характеристик физиологических

закономерностей образования звуков в различных языках, определяе-

мых общими принципами формирования речевого звучания, для кото-

рых первичным является наличие около 50 звуков речи, разделяемых

на гласные и согласные.

Большинство современных методов анализа звуков речи основаны

на спектральной модели стационарного сигнала [3]. Недостатком этой

модели является отсутствие вероятностных характеристик для основ-

ных шумовых составляющих в произносимых согласных, и это при

78 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2011. № 3

SEO Version

Warning.

You are currently viewing the SEO version of !text.
It has a number of design and functionality limitations.

We recommend viewing the Flash version or the basic HTML version of this publication.

1 2,3,4,5,6,7,8,9,10