Claude App被指降智?开启思考模式仍难解经典“水果题”

近日,有科技社区用户反馈,在Claude官方App客户端中使用Opus模型测试经典的“水果题”(测试字符计数逻辑)时,即便开启了“思考开关”,模型仍反复给出错误答案(如29),而此前在网页版或其他环境下该模型能正确输出(如21)。用户质疑官方App是否存在“降智”处理,或Pro订阅用户被区别对待。这一现象引发了关于大模型在不同客户端表现一致性的讨论,也再次揭示了LLM在处理字符级精细逻辑时受限于底层Tokenization机制的固有缺陷。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册