Хотя у avr всё равно нет циклического сдвига без переноса.
Хотя даже в этом случае можно было бы сделать лучше, если бы компилятор допёр - что именно требуется и двигая один раз (одинм циклом), копируя нужный бит в С перед сдвигом.
avr-gcc
ROTL:
push r14
push r15
push r16
push r17
clr r21
movw r14,r22
movw r16,r24
mov r0,r20
rjmp 2f
1: lsl r14
rol r15
rol r16
rol r17
2: dec r0
brpl 1b
ldi r18,lo8(32)
ldi r19,hi8(32)
sub r18,r20
sbc r19,r21
rjmp 2f
1: lsr r25
ror r24
ror r23
ror r22
2: dec r18
brpl 1b
or r22,r14
or r23,r15
or r24,r16
or r25,r17
pop r17
pop r16
pop r15
pop r14
ret
конечно, до mingw32-gcc далеко :-)
_ROTL:
movzbl 8(%esp), %ecx
movl 4(%esp), %eax
roll %cl, %eax
ret