GLM-5架构大揭秘:vLLM代码指认其全面复用DeepSeek V3设计

近日,vLLM开源社区的一项新代码合并请求(PR #34124)引发了业内高度关注。代码信息强烈暗示,智谱AI即将发布的GLM-5模型在底层架构上将全面对齐DeepSeek-V3系列。具体证据显示,GLM-5并非简单的借鉴,而是代码级复用了DeepSeek V3及V3.2的核心架构逻辑,明确采用了DSA Deepseek稀疏注意力机制以及DeepSeek MTP(多标记预测)技术。这一动态表明,DeepSeek所引领的技术路线正展现出强大的统治力,头部大模型厂商在下一代架构上可能正出现罕见的“技术趋同”现象。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册