пятничные размышления о вреде быстрых алгоритмов (ну или об их бесполезности) («Телесистемы»: Конференция «Цифровые сигнальные процессоры (DSP) и их применение»)

[an error occurred while processing this directive] пятничные размышления о вреде быстрых алгоритмов (ну или об их бесполезности)

(«Телесистемы»: Конференция «Цифровые сигнальные процессоры (DSP) и их применение»)

Отправлено yes 01 июля 2005 г. 09:35

в то время как космические корабли бороздят... тьфу

в современных процессорах операция умножения уже давно не является критической по времени, как правило она выполняется в N раз быстрее, чем сдвиг (N>=2)

при этом во всяких векторных блоках (MMX, SSE, Altivec и т.п.) вроде как это N>>1, к счастью или несчастью мне не доводилось программировать такие процы и я не знаю прав или лев

так же в ПЛИС-ах - практически невозможно достать нормальную ПЛИС, в которой не было бы умножителей, и тратить на сдвиги трассировочные ресурсы вместо использования умножителей - глупо

то же и с АЗИКами (VLSI, как их любят называть научные перцы) - вроде сэкономив, вентиля на умножители - получится выигрыш в площади и потреблении - но это далеко не так очевидно - умножители бывают в виде одной ячейки, которая меньшей площади (на вентилях съедает трассировка площадь - реально они достаточно неплотно на кристалле расположены) и жрет меньше (основное потребление КМОП - перезарядка емкостей - то есть трассировки)
и при использовании быстрого алгоритма - теряется регулярность и усложняется тестирование (особенно если матрица факторизуется не регулярным образом (типа FFT), а каким нибудь более извращенным)

--------------------

про конструктивизм - даещь алгоритмы в которых уменьшено количество обращений в память и [условных] переходов - самых неприятных процессорных операций в наше время

ведь должен кто-то такие алгоритмы придумывать...

может я и ошибаюсь, но заоптимизированное DCT оценивается у меня на BF не быстрее, чем в лоб (может я их готовить не умею..., если не обломаюсь писать/симулировать - еще напишу)

Составить ответ ||| Конференция ||| Архив

Ответы

Что-то не все ясно (+) — SM (01.07.2005 14:52 213.141.159.26, 1094 байт)
- ради спора :) - а для FatRobot-а у меня тоже не получилось.... — yes (01.07.2005 15:29 194.133.69.2, 670 байт)
Стоит взглянуть на "быстрые" алгоритмы несколько шире: — Fat Robot (01.07.2005 11:56 213.234.205.33, 322 байт)
- ну я вот поискал - поискал оптимизацию по обращениям к памяти - ничего не нашел... — yes (01.07.2005 12:11 194.133.69.2, пустое)
  - Из чего следует, — Fat Robot (01.07.2005 12:14 213.234.205.33, 61 байт)
    - нужна экспертная оценка этого поля :) — yes (01.07.2005 12:16 194.133.69.2, пустое)
      - На самом деле "быстрость" — Fat Robot (01.07.2005 12:23 213.234.205.33, 227 байт)
такой же вопрос стоит в телефонии: а так ли необходимо сжимать голос при нынешней огромной пропускной способности каналов. — 2b|!2b?.. (01.07.2005 11:35 212.46.19.12, пустое)
- не согласен - все-таки какая бы ни была пропускная способность - на все каналы, которые хочется засунуть никогда не хватало... — yes (01.07.2005 12:13 194.133.69.2, пустое)
- Признаюсь, — Fat Robot (01.07.2005 12:12 213.234.205.33, 145 байт)
Мне кажется что сейчас глупо (кроме ОЧЕНЬ редких случаев) на ассемблере оптимизировать. Лучше тщательнее пинать С компилятор. — Артем (01.07.2005 11:22 221.146.44.61, пустое)
- ну и без разницы на С пишем или в кодах. даже при использовании С больше вероятность, что "хитрости" несоптимизируются — yes (01.07.2005 12:19 194.133.69.2, 26 байт)
- ну у извращенных процев. (DSP) как правило есть такие инструкции, о которых компилер и не подозревает — yes (01.07.2005 12:15 194.133.69.2, 114 байт)
- Да умножения, при соответств. базе элементн., никто специально не экономит. Уже лет дофига как. — -=ВН=- (01.07.2005 11:34 194.190.181.231, пустое)
  - ну а пример какой-нибудь статьи, где оптимизировался бы доступ к памяти или что-то еще кроме умножения? — yes (01.07.2005 12:23 194.133.69.2, 196 байт)
    - Да какая тут к черту научная новизна? В энономии load, store? — -=ВН=- (01.07.2005 12:44 194.190.181.231, 616 байт)
      - возьмем для примера N=8 R=2 — yes   (01.07.2005 13:42 194.133.69.2, 578 байт)
        
        Неправильно Вы считаете:-) — -=ВН=-   (01.07.2005 14:14 194.190.181.231, 455 байт)
        
        ну вобщем все зависит от архитектуры :) то есть от того как считать — yes   (01.07.2005 14:45 194.133.69.2, 595 байт)
        
        Это палка о 3-х концах — -=ВН=-   (01.07.2005 15:06 194.190.181.231, 297 байт)
        
        а Вы сталкивались с процами с бабочкой? ведь не может их не быть... — yes   (01.07.2005 15:39 194.133.69.2, 1 байт)
        
        По-моему нет, если не считать специал. серии 1815, но это все-таки не проц. И не считать микросхем- Фурье-процессоров законченных (у plessey, например). И не считать того, что бывает сдуру в плисине чего-нибудь изображу подобное. — -=ВН=-   (01.07.2005 15:46 194.190.181.231, пустое)
        
        Хотя ошибаюсь, бабочкины начала (с прореживанием по частоте) встречались. Ну типа a+b,a-b за один присест. — -=ВН=-   (01.07.2005 15:48 194.190.181.231, пустое)
  - Промахнулся. Под сообщением yes д.б. — -=ВН=- (01.07.2005 11:36 194.190.181.231, пустое)
- Что же такой разброс у ''корейцев''? Один компилятор пинать собрался, у второго БПФ на С вызывает рвотную реакцию. — -=ВН=- (01.07.2005 11:28 194.190.181.231, пустое)
единственная польза - это возможность поупражнять мозги, так как разработка (и даже программирование) быстрых алгоритмов это требует — yes (01.07.2005 09:41 194.133.69.2, пустое)

Перейти к списку ответов ||| Конференция ||| Архив ||| Главная страница ||| Содержание ||| Без кадра

E-mail: info@telesys.ru

Ответы

Отправка ответа