[an error occurred while processing this directive]
|
При распознавании речи (в каждом из трех методов) после FFT считаются "Scarf stripes" -умножение вектора частот на треугольные окна c суммированием для расчета энергий в заданных интервалах. Типа 40-100 Гц, 80-400, 300-1100...(точные значения мскать лениво, уж не обессудьте, потому как бесполезно для Вас).
Потому, что теорией установлено: полученный вектор значений является характерным, то есть не зависит практически от скорости произношения, эмоционального состояния. Основная проблема, как оказалось - попасть в начало информационной части выборки.
Вам же достаточно с любого места пару периодов взять. Но нет у Вас и теории, что на разных дорогах, при топливе разных заводов движок будет звучать одинаково.
E-mail: info@telesys.ru