针对“DeepSeek V4因适配华为芯片而延期”的传闻,其最新技术报告给出了有力回击。报告数据显示,V4的细粒度专家分区方案已同时在NVIDIA GPU和华为昇腾NPU上验证,常规推理加速1.5至1.73倍,特定场景最高加速近2倍。团队已将相关内核开源。这一成果不仅证伪了跨平台迁移会造成性能折损的说法,更表明国产算力底座已能支撑顶尖大模型的极致性能需求。
原文链接:Linux.do
针对“DeepSeek V4因适配华为芯片而延期”的传闻,其最新技术报告给出了有力回击。报告数据显示,V4的细粒度专家分区方案已同时在NVIDIA GPU和华为昇腾NPU上验证,常规推理加速1.5至1.73倍,特定场景最高加速近2倍。团队已将相关内核开源。这一成果不仅证伪了跨平台迁移会造成性能折损的说法,更表明国产算力底座已能支撑顶尖大模型的极致性能需求。
原文链接:Linux.do
评论前必须登录!
立即登录 注册