[an error occurred while processing this directive]
|
В голосе много повторяющихся слов и целых фраз и надо его сжать.
Я думаю сделать так:
1) Взять голос и разбить на элементарные волны (wavelet)
2) Дальше разбить каждую на фрагменты по такому алгоритму: если амплитуда за последние N(зависит от частоты) отсчетов значительно изменилась, то разбить
3) В местах пересечения фрагментов разных элементарных волн разбить еще на несколько фрагнментов
4) сравнить каждый фрагмент с остальными фрагментами
Но этот алгоритм по-моему будет малоэффективен, т.к. надо учитывать и корректировать фазу и амплитуду каждого фрагмента
Может есть что-то более простое???
E-mail: info@telesys.ru