В dsPIC любые пересылки занимают 1 такт, включая память-память или i/o-память, да еще и с автодекрементом/инкрементом, аппаратными кольцевыми буферами, битреверсной адресацией и т.д. На сайте Atmel же ясно сказано про топку - Conventional ARM9-based processors use load/store instructions that require at least 80 CPU cycles to transfer a single byte of data between memory and a peripheral