Рис. 3. Модель системы распознавания голоса диктора, использующая адаптив-
ные деревья вейвлет-пакетов для извлечения характеристических признаков
Данная модель предполагает извлечение характеристических при-
знаков непосредственно из вейвлет-коэффициентов на разных уровнях
разложения, что позволит уменьшить объем дополнительных вычисле-
ний. С другой стороны, построение адаптивных деревьев с достаточ-
ным разрешением по частоте предполагает, что будет использовано как
минимум 7 уровней разложения, что требует большого объема вычи-
слительных ресурсов. В модели, представленной на рис. 4, достаточно
использовать всего 3 уровня разложения.
Вычислительные затраты, которые требуются для достижения тре-
буемого разрешения по частоте, являются, пожалуй, единственным
недостатком представленной системы.
Выводы.
Методыраспознавания голоса диктора, основанные на
преобразовании Фурье, хорошо справляются с поставленной задачей в
идеализированной окружающей обстановке, однако в реальных систе-
110 ISSN 0236-3933. Вестник МГТУ им. Н.Э. Баумана. Сер. “Приборостроение”. 2008. № 3