Claude 被曝严重“降智”:实测评分暴跌、代码错误激增,高阶用户质疑模型稳定性

一位高阶付费用户发帖反馈,Claude 模型在过去三天内表现出明显的“降智”趋势,原本的发散性处理能力大幅退化,变得“言听计从”且缺乏兜底能力。在其全自动驾驶 AI 开发项目 solodawn 的实测中,相同测试任务的评分从 83 分断崖式下跌至 62 分,TypeScript 错误数更是从昨天的 0 个激增至 72 个。在排除了数据复用和架构问题后,用户将矛头直指官方模型的变动,质疑在官方积极推广之际,核心能力反而出现了严重衰退。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册