[an error occurred while processing this directive]
|
Вот код для Радикс4 комплексного (!) 32 разрядного БПФ (только бабочка):
lcntr = ustat3, do _in_loop until lce;
f11=f1*f5, f7=f9+f14, f3=f9-f14, f9=dm(i5,m3), f8=pm(i13,m11);
f13=f0*f4, f14=f10-f12, f1=dm(i5,m4), f0=pm(i13,m12);
f10=f1*f4, f15=f11+f13, dm(i4,m4)=f3, pm(i12,m12)=f2;
_in_loop:
f12=f0*f5, f6=f8+f15, f2=f8-f15, dm(i4,m3)=f7, pm(i12,m11)=f6;
Т.е. фактически на выполнение БПФ двух действительных 32битных векторов одновременно Шарку надо всего 4 операции в бабочке.