近日,科技论坛 Linux.do 及社交平台 X 上出现了关于 Anthropic 旗下 Claude 模型的集中讨论。多位资深用户和开发者反馈,近期接触到的 Claude Opus 模型新版本(据称为内部版本 4.7 和 4.8)在综合表现上不仅没有提升,反而出现了明显的“倒退”。用户指出,新版本在复杂逻辑推理、指令遵循以及代码生成等任务上的表现均不及之前的 4.6 版本,被戏称为“变笨了”。这一现象引发了社区对于 AI 模型迭代稳定性的担忧。作为 ChatGPT 的主要竞争对手,Claude 一直凭借其出色的推理能力和自然语言处理体验受到推崇,但此次负面反馈可能暗示了厂商在模型训练中可能遇到了“对齐税”(Alignment Tax)问题,即为了提高安全性或降低风险而牺牲了模型的通用智力。对于依赖特定模型版本进行 AI 编程或 Agent 开发的用户而言,模型能力的随机波动不仅降低了开发效率,也加剧了对于闭源商业模型稳定性的信任危机。
事件分析
💡 核心观点:模型能力的非预期退化揭示了AI厂商在安全性与功能性之间权衡的困境,稳定性与一致性或将成为下一代大模型竞争的关键壁垒。
原文链接:Linux.do

评论前必须登录!
立即登录 注册