DeepSeek V4 传闻转投华为昇腾:去英伟达化的这场“大考”,比跑分更关键

DeepSeek V4 模型即将发布,业界关注的焦点不再局限于基准跑分,而是其背后的算力底座重构。据传,在跳票一年多后,该模型已将底层训练架构从英伟达 CUDA 全面迁移至华为昇腾生态。如果 DeepSeek 真的在国产显卡上成功跑通万亿参数的混合专家(MoE)模型,这将是对国产算力集群能否承载超大规模 AI 训练的一次关键验证。无论性能是否完全对标英伟达,这一“去美化”尝试的落地,都标志着国产 AI 产业链在打破硬件垄断、探索自主生态上迈出了实质性的一步。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册