近日,科技社区Linux.do上有开发者用户指出,Anthropic旗下的Claude Opus大模型出现了明显的性能退步现象。该用户反馈称,目前的模型不仅逻辑能力(“智商”)似乎有所下降,回答中甚至出现了模仿GPT风格的“口癖”,且被怀疑直接使用了Qwen(通义千问)和DeepSeek(深度求索)的数据进行“蒸馏”。帖子分析认为,这一变化的核心原因可能在于Anthropic难以长期承担巨量参数(如5T至20T)模型的训练与推理成本。推测Anthropic从4.7版本开始,为了在控制成本的同时维持竞争力,尝试将模型容量缩减至2T至3T参数量,试图以更小的规模与DeepSeek-v4-pro(约1.4T)等高性价比模型抗衡。这一讨论反映了市场对头部大模型厂商在商业化压力下可能牺牲模型质量的担忧。
事件分析
💡 核心观点:当Scaling撞上成本墙,大模型厂商为维持利润率,或将被迫通过蒸馏技术和缩减参数寻求“性价比”的生存之道。
原文链接:Linux.do

评论前必须登录!
立即登录 注册