[an error occurred while processing this directive]
|
Если идти первым путем - то есть сравнивать спектральный состав с двух микрофонов - то тут не требуется такого требования, что бы полезный сигнал не проникал во второй микрофон. Достаточно, что бы он туда проникал с определенным ослаблением. Так как в случае отсутствия речи спектральный состав будет близок, в случае речи - он будет различен. Вот и VAD. А для адаптивной фильтрации это, конечно, важно (проникновение полезного сигнала). Но тут я конкретного ничего не посоветую, особенно в части борьбы с нелинейным эхо. Сам не занимался, а копать и бурить сейчас некогда :).
добавлю - можно пытаться считать ВКФ этих двух сигналов, таким образом отловить с какой задержкой приходит речевой (ослабленный) сигнал во второй (опорный) микрофон. И попытаться вычесть его оттуда. Так как источник шума удален от микрофонов на значительно большее расстояние чем рыло говорящего туда индивидуума, максимум ВКФ по шумовой составляющей должен по идее быть на небольших смещениях, а максимум ВКФ по речевой составляющей - на более больших. Вот такая идея.
E-mail: info@telesys.ru