[an error occurred while processing this directive]
|
получается 12 бабочек
каждая представляет из себя
2 загрузки
2 выгрузки
2 сложения
1 умножение (если не Фурье, то до 4-х умножений)
"любимый" NlogN=12
и всего 12*7=84 оп
в лоб 64 мультиплай-аккумулейт
если есть 16 регистров (что часто случается) - нужно +
8 загрузки
8 выгрузки
64+16=80
ну я слегка подогнал - так как для 8-ми бабочек можно тоже "захардкодить" передачу регистров, но это увеличивает размер кода и требует больше fetch-ей (что при наличии буфера инструкций дает проигрышь)
то есть вопрос не такой уж и очевидный.
E-mail: info@telesys.ru