开发者实测质疑 Cursor Composer 2:简单任务频出错,性能反不及老牌模型

针对近期 Cursor 官方宣称的“Composer 2 性能超越 Opus”引发热议,有开发者发布实测报告予以反驳。该用户在测试简单的 Python 环境调用任务时发现,Cursor 新模型不仅出现错误,甚至在用户提醒后直接遗忘了核心目标,逻辑连贯性极差。测试者指出,在仅 50k 上下文窗口下表现如此糟糕,令人担忧其生产环境可用性。相比之下,其对比的老牌模型(Opus 4.6)则一次回答正确。该反馈揭示了部分 AI 编程工具存在“营销强于实战”的现象,提醒业界需理性看待模型参数与宣传。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册