На 99.9% где-то в цикле слишком массированное обращение в IO-space. Без оптимизации оно происходит достаточно редко, при включенной оптимизации забивает контроллер IO-шины на столько, что ему не хватает времени на отработку обращения с DMA. Лечение - нопов туда.