DeepSeek 近日频繁更新其 GitHub 仓库,显示出对底层基础设施的持续重视。主要更新集中在 DeepGEMM 项目,开发者修复了在英伟达 H100 显卡上运行 FP8 GEMM 内核时特定尺寸(n=768)下可能发生的崩溃问题。此外,3FS 仓库也进行了构建脚本的小幅优化。这些细微但关键的修复表明,DeepSeek 正致力于确保其模型在顶级硬件上的极致性能与稳定性,为后续更高效的推理和训练打下坚实基础。
原文链接:Linux.do
DeepSeek 近日频繁更新其 GitHub 仓库,显示出对底层基础设施的持续重视。主要更新集中在 DeepGEMM 项目,开发者修复了在英伟达 H100 显卡上运行 FP8 GEMM 内核时特定尺寸(n=768)下可能发生的崩溃问题。此外,3FS 仓库也进行了构建脚本的小幅优化。这些细微但关键的修复表明,DeepSeek 正致力于确保其模型在顶级硬件上的极致性能与稳定性,为后续更高效的推理和训练打下坚实基础。
原文链接:Linux.do
评论前必须登录!
立即登录 注册