сейчас почти любой процессор выполняет умножение за такт, и как показал проведенный мной анализ :) большая часть времени тратится на операции пересылки память->рабочий регистр->память (одно из свойств риск процессоров - выполнение математических операций только с рабочими регистрами, и если регистровый файл состоит из 16 регистров из которых часть занята компилятором, то для каждой "бабочки" нужно выполнить 8 операций чтения/записи >16 тактов и 6 тактов на вычисления)
Вопрос - кто-нибудь встречал в литературе/сети описания алгоритмов БПФ для РИСК процессоров?
Использование архитектур DSP с разными шинами программной памяти и памяти данных конечно хорошо.
Но все-таки может можно быстро БПФ посчитать и для RISK?