[an error occurred while processing this directive]
|
Интересует два варианта:
1)Без адаптивной фильтрации
Нужен хороший VAD. Пропускаем сигнал с улицы только при наличии голоса. Этот вариант меня в основном устраивает. Ну и что, что шум пройдет вместе с речью? Главное чтобы все остальное время шума не было.
2)С адаптивной фильтрацией
Я попробовал поэксперементировать немного.
В Матлабе есть RLS DEMO. Я ее немного доработал чтобы брать сигнал из wav файла (2 канала) и результат посылать в выходной wav-файл. Далее в звуковом редакторе записал голос (по одному каналу) и наложил на него коричневый шум(по двум каналам). Этот файл подал на вход модели. Все работает. RLS дает наилучшие результаты. NLS и Кальман заметно искажают полезный сигнал (речь). Далее взял два микрофона с предусилителями и подал сигнал с них на вход звуковой карты. Здесь пока ничего не получается. Нет сходимости. Вернее есть, но только если расстояние между микрофонами не больше 15-20 см. Сразу оговорюсь, что занимался этой темой, что называется, между делом и глубоко в теорию не лез. Похоже есть тонкости, про которые я пока не знаю. Собственно мне не нужно 20 дБ от адаптивной фильтрации. Хватило бы и 9, чтобы нормально заработал VAD, а он уже задавит в паузах шум намертво. Возможно имеет смысл ограничить спектр сигналов, подаваемых на адаптивный фильтр, сверху до 1 кГц (или еще ниже) - там где сосредоточена основная энергия речевого сигнала, где меньше длина волны. Возможно это улучшит сходимость.
E-mail: info@telesys.ru