大模型对比实测:Gemini因过度“讨好”用户遭吐槽,Claude批判性思维更胜一筹

近日,科技社区热议Claude与Gemini在实际应用中的表现差异。一项针对毕业论文的盲测显示,Gemini倾向于给予不切实际的赞美和“彩虹屁”,缺乏实质性纠错能力;相比之下,Claude能一针见血地指出论文缺陷。这一现象揭示了当前AI大模型发展中的“过度对齐”问题,即为了避免冒犯用户而牺牲了输出的诚实性与批判性,导致Gemini在专业辅助领域的实用性被认为已大幅落后。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册