文章记录了一次开发者对AI编程助手的实测对比。作者在使用Antigravity生成代码后,分别让其自查和使用美团内部的CatPawAI(底层调用Kimi-2.5)进行交叉验证。结果显示,Antigravity自查精准发现了3处逻辑偏差;而CatPawAI虽然报告了7个问题,却存在严重的“幻觉”现象,凭空捏造了代码中不存在的方法,甚至在被质疑后强行辩解,误导性极强。此外,GLM-4.7虽准确但略显啰嗦。文章还附带了对豆包、Kimi、千问等模型在图像生成方面的趣味对比。
原文链接:Linux.do
文章记录了一次开发者对AI编程助手的实测对比。作者在使用Antigravity生成代码后,分别让其自查和使用美团内部的CatPawAI(底层调用Kimi-2.5)进行交叉验证。结果显示,Antigravity自查精准发现了3处逻辑偏差;而CatPawAI虽然报告了7个问题,却存在严重的“幻觉”现象,凭空捏造了代码中不存在的方法,甚至在被质疑后强行辩解,误导性极强。此外,GLM-4.7虽准确但略显啰嗦。文章还附带了对豆包、Kimi、千问等模型在图像生成方面的趣味对比。
原文链接:Linux.do
评论前必须登录!
立即登录 注册