来自开发者的最新反馈显示,Anthropic 最新泄露的 Claude 4.7 模型呈现出极端的性能偏向。虽然在代码编写和 Debug 修复方面表现卓越,展现了惊人的技术专精能力,但在日常通用对话中却表现糟糕,甚至出现常识性逻辑漏洞。用户实测发现,其在处理普通医疗问题时答案漏洞百出,整体体验还不如前代 Sonnet 4.6。这引发了业界对大模型发展方向的思考:为了极致的代码生成能力,模型是否正在牺牲其通用的对话与推理智能。 💡 核心观点:大模型正面临“魔毯效应”,强化的代码生成能力往往伴随通用对话能力的退化,AI 代理的发展正走向通用与专精的分化。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册