Тем, что из памяти из одного адреса "достается" одна VLIW-инструкция, содержащая в себе от 1 до 8-ми инструкций юнитам, в отличие от двух ядер, которые достают свои инструкции по своим отдельным счетчикам команд. Т.е. при 8-юнитовости компилер локально распараллеливает куски кода, а не глобально весь алгоритм.