[an error occurred while processing this directive]
|
Если числа 16-битные, загружаем в R0 по два числа за раз,
итого цикл в два раза короче, в цикле только одна 64-бит инструкция:loop_begin:
A1 += R0.H*H0.H, A0 += R0.L*R0.L (IS) || R0 = [I0++];
loop_end:A0 += A1;
Но по БПФ Шарку наверное проиграет..