[an error occurred while processing this directive]
|
Что если тоже выбросить эти циклы предустановок, то 31-битное умножение там пролетит за 2 такта:
1) A0=R1.H*R2.H , A1=R1.H*R2.L (M) || R0=[I0++] || R3 = [I1++];
2) A1+=R2.H*R1.L (M);
Одновременно с этим можно в каждом из тактов еще загрузить/записать 4 32 разрядных значения в регистры/память - в первой строчке написано для примера как...