ствах основывается на оценке спектральных характеристик гласных
звуков, полученных на основе преобразования Фурье. Вычисление
спектрально-формантных характеристик и динамических спектро-
грамм частотно-временного представления речевого сигнала осуще-
ствляется с использованием БПФ.
В целях получения реальных характеристик тракта аудиовво-
да комплекса “ИКАР Лаб II+” выполнено тестирование устройства
“КАМЕРТОН”. Получены следующие данные: неравномерность ам-
плитудно-частотной характеристики (АЧХ) в частотном диапазоне от
40 Гц до 15 кГц составляет + 0,01 дБ, – 0,01 дБ; уровень шума 82,5 дБ;
динамический диапазон 82,3 дБ; нелинейные искажения 0,0034%;
интермодуляционные искажения 0,030%.
При проведении криминалистической экспертизы множество аку-
стических признаков голоса и речи исследуемого диктора может быть
представлено в виде совокупности фонетических (акустических) клас-
сов: гласные звуки (ударные, безударные) и согласные (назальные,
аффрикаты, щелевые и др.). Эти акустические классы отражают ар-
тикуляторные особенности речи диктора, а также конфигурацию его
речевого тракта.
Известные методы анализа звуков речи основываются на спек-
тральной модели стационарного сигнала [9]. Основным недостатком
этой модели является отсутствие характеристик для шумовых соста-
вляющих в произносимых согласных звуках, и это при том, что в
большинстве языков основная речевая информация передается соглас-
ными. Традиционно разрабатываемые алгоритмы идентификации лич-
ности по голосу и распознавания речи основываются, как правило, на
определении характеристик гласных звуков.
Разработанная специалистами Центра речевых технологий мето-
дика криминалистической идентификации дикторов по речи на рус-
ском и других языках [10], является развитием известной методики
идентификации дикторов “Диалект” [11] и также включает в себя на
этапе инструментального анализа сравнение статистик основного тона
голоса и формант, формантное выравнивание, экспертное сравнение
формант ударных гласных.
На рис. 2 приведен один из типичных примеров формантного срав-
нения речи двух дикторов, приводимых в качестве иллюстрации к
заключению эксперта [10].
Анализ речевого сигнала с использованием преобразования
Фурье.
Преобразование Фурье является классическим методом ча-
стотного анализа стационарных сигналов непрерывного времени
(CTFT). При этом сигнал раскладывается в базис синусов и коси-
нусов различных частот. Коэффициенты преобразования находятся
ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2012. № 2 39