新算法突破浮点矩阵乘法瓶颈,大幅提升GPU/CPU算力效率

本文提出了一种在浮点运算环境下高效计算大有限域矩阵乘法的新方法。现有技术因浮点尾数限制,通常只能处理较小的素数位宽。该研究创新性地采用多字分解技术,成功将双精度算力支持的素数位宽上限从26位提升至52位。在CPU和GPU上的实验表明,该方法不仅大幅超越现有方案,还能在更高精度下保持高性能,为计算机代数和高性能计算提供了重要的算力优化路径。

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册