实测对比:国产大模型胜任日常开发,但攻坚 iOS 复杂 Bug 还得靠 Claude

一位同时订阅 Claude、GPT 及国产 GLM 的开发者分享实战体会:在常规的线性开发任务中,国产大模型 GLM 5.1 已能较好满足需求。然而,在修复一款 iOS 相机应用中棘手的美颜算法 Bug 时,即使经过多轮尝试,GPT-4 和 GLM 5.1 均未能给出完美方案,最终 Claude Opus 一次性解决了问题。这一案例生动揭示了当前大模型的现状:虽然在普通场景下差距缩小,但在高难度、强逻辑的“攻坚”时刻,顶尖模型依然具备难以撼动的技术壁垒。

原文链接:V2EX 分享发现

抢沙发

评论前必须登录!

立即登录   注册