Claude Opus 4.7 实测翻车?连基础逻辑“糖果题”都解不开

近期,关于 Claude Opus 4.7 的性能在社区引发热议。有科技爱好者通过第三方渠道对该模型进行了实测,结果显示,即便是在面对经典的“糖果问题”等基础逻辑推理题时,该模型依然给出了错误答案。这一表现引发了用户对新模型能力的强烈质疑,认为其逻辑能力不仅未超越前代,甚至可能出现了倒退。此次测试再次折射出当前大语言模型在底层逻辑推理和数学归纳能力上仍存在显著瓶颈。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册