.
ldi R16,205 ; делитель (5)
mul R4,R16 ; делимое X в R5:R4
movw R2,R0
mul R5,R16
add R0,R3
brcc PC+2
inc R1
lsr R1
ror R0
lsr R1
ror R0 ; R1:R0 = X*205/1024 == X/5
.
13 тактов с точностью лучше 0.1%
даже если прибавить чтение+запись из/в SRAM, будет только 21 такт