打破硬件壁垒:LAPIS编译框架实现AI稀疏计算的高效跨平台优化

该项目开发了基于MLIR的LAPIS编译器框架,旨在解决多样化硬件架构(特别是GPU)上的性能可移植性难题。其核心创新在于引入了Kokkos方言,能够将高级语言代码优雅地降级转换至不同底层架构,并支持科学机器学习(SciML)模型的高效集成。此外,新开发的分区方言专门用于管理分布式内存架构下的稀疏张量与通信模式,显著降低了通信开销。实测表明,该框架有效提升了从图内核到关系数据库(TenSQL)等多种复杂应用在不同GPU上的运行性能。

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册