например по сцылке архитектура, которая порвет всех мультикоров по всем параметрам
когда-то что-то подобное делал для FPGA - не проблема 100МАС на такт при 100МГЦ получить на какомнибудь VFX70 если перенести в АЗИК - какой-нибудь 65нм LX получится 1000МАС при 400-500МГц а если брать G / HP (с кулером) то 1000 на 1000МГц - терамак
для продукта генерик пёрпоз дсп (типа ад или ти) гораздо важнеее наличие средств разработки, а не архитектурных изысков