最新技术基准测试揭示了一个反直觉的现象:在Windows 11 ARM的Prism仿真环境下,针对较新的AVX2指令集优化的代码,其运行速度竟显著落后于针对老旧SSE2-4.x指令集优化的代码。数据显示,AVX2代码的仿真性能仅为SSE代码的三分之二。究其原因,AVX2的256位宽操作在128位宽的ARM NEON架构上进行仿真时产生了巨大的转换开销,导致其理论上的性能优势荡然无存。作者强烈建议,若开发者重视应用在Windows ARM平台上的表现,不应依赖x64指令集的仿真兼容,而必须直接编译为ARM原生代码。
原文链接:Hacker News

IT资源栈
评论前必须登录!
立即登录 注册