近日,vLLM开源社区的一项新代码合并请求(PR #34124)引发了业内高度关注。代码信息强烈暗示,智谱AI即将发布的GLM-5模型在底层架构上将全面对齐DeepSeek-V3系列。具体证据显示,GLM-5并非简单的借鉴,而是代码级复用了DeepSeek V3及V3.2的核心架构逻辑,明确采用了DSA Deepseek稀疏注意力机制以及DeepSeek MTP(多标记预测)技术。这一动态表明,DeepSeek所引领的技术路线正展现出强大的统治力,头部大模型厂商在下一代架构上可能正出现罕见的“技术趋同”现象。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册