传统AI评测多聚焦于模型智商,但最新的“鞍座”评测揭示了惊人事实。在调用完全相同的Opus-4.7-medium模型时,Cursor CLI和Claude Code得分均超过60分,而OpenCode仅获37分。这表明对于AI编程助手而言,底层的工程化交互能力已成为决定性能上限的关键瓶颈,并非模型强就能产出好代码。
原文链接:Linux.do
传统AI评测多聚焦于模型智商,但最新的“鞍座”评测揭示了惊人事实。在调用完全相同的Opus-4.7-medium模型时,Cursor CLI和Claude Code得分均超过60分,而OpenCode仅获37分。这表明对于AI编程助手而言,底层的工程化交互能力已成为决定性能上限的关键瓶颈,并非模型强就能产出好代码。
原文链接:Linux.do
评论前必须登录!
立即登录 注册