Анализ способов извлечения характеристических признаков речи с использованием вейвлетов при решении задачи распознавания голоса диктора в условиях сложной шумовой обстановки - page 1

Александр Владимирович Брешенков родился в 1955 г., окон-
чил МВТУ им. Н.Э. Баумана в 1982 г. Д-р. техн. наук, доцент
кафедры “Компьютерные системы, комплексы и сети” МГТУ
им. Н.Э. Баумана. Автор 70 научных работ в области САПР
ЭВМ и баз данных.
A.V. Breshenkov (b. 1955) graduated from the Bauman Moscow
Higher Technical School in 1982. Ph. D. (Eng.), assoc. professor
of "Computer Systems, Complexes and Networks" department of
the Bauman Moscow State Technical University. Author of 70
publications in the field of systems of automated design and data
bases.
Александр Викторович Балдин родился в 1951 г., окон-
чил МВТУ им. Н.Э. Баумана в 1974 г. Д-р техн. наук, на-
чальник отдела интеграции информационных систем МГТУ
им. Н.Э. Баумана. Автор 73 научных работ в области автомати-
зации и моделирования процессов управления и баз данных.
A.V. Baldin (b. 1951) graduated from the Bauman Moscow Higher
Technical School in 1974. D. Sc. (Eng.), head of department for
integration of information systems of the Bauman Moscow State
Technical University. Author of 73 publications in the field of
automation and simulation of management processes and data
bases.
УДК 621.391:681.317
В. Б. К р о п о т о в, Н. В. М е д в е д е в,
И. И. Т р о и ц к и й
АНАЛИЗ СПОСОБОВ ИЗВЛЕЧЕНИЯ
ХАРАКТЕРИСТИЧЕСКИХ ПРИЗНАКОВ РЕЧИ
С ИСПОЛЬЗОВАНИЕМ ВЕЙВЛЕТОВ ПРИ
РЕШЕНИИ ЗАДАЧИ РАСПОЗНАВАНИЯ ГОЛОСА
ДИКТОРА В УСЛОВИЯХ СЛОЖНОЙ ШУМОВОЙ
ОБСТАНОВКИ
Рассмотрены основные понятия преобразований сигналов (Фурье,
Вейвлет), а также исследованы основные модели распознавания
речи на основе этих преобразований. В процессе анализа алгорит-
мов распознавания предложенных моделей выявлены основные не-
достатки и преимущества каждой из моделей, а также даны ре-
комендации по использованию в конкретных условиях зашумления.
Выделение характеристических признаков говорящего человека –
основа систем распознавания голоса диктора. При этом использова-
ние “сырого” сигнала без предварительной обработки практически не
дает положительного результата. Классическим методом при анализе
дискретных сигналов является быстрое преобразование Фурье (БПФ)
с окном. Однако при анализе сигнала в зашумленной обстановке в
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2008. № 3 103
1 2,3,4,5,6,7,8,9,10
Powered by FlippingBook