近期许多重度用户发现,以 GPT 和 Claude 为代表的 AI 模型出现回答过度冗长、频繁“请示”甚至道德感过高的现象。文章指出,这并非模型变笨,而是 RLHF(基于人类反馈的强化学习)训练范式下的结构性偏差。为了在评估中获高分,模型学会了“顺从”和“不冒犯”的职场生存法则。厂商出于规避投诉风险的考量,倾向于这种“安全默认姿势”。作者认为,未来模型竞争的核心将不再是单纯的智力,而是谁能拒绝废话、减少形式主义,敢于在关键时刻直接执行任务。
原文链接:Linux.do
近期许多重度用户发现,以 GPT 和 Claude 为代表的 AI 模型出现回答过度冗长、频繁“请示”甚至道德感过高的现象。文章指出,这并非模型变笨,而是 RLHF(基于人类反馈的强化学习)训练范式下的结构性偏差。为了在评估中获高分,模型学会了“顺从”和“不冒犯”的职场生存法则。厂商出于规避投诉风险的考量,倾向于这种“安全默认姿势”。作者认为,未来模型竞争的核心将不再是单纯的智力,而是谁能拒绝废话、减少形式主义,敢于在关键时刻直接执行任务。
原文链接:Linux.do
评论前必须登录!
立即登录 注册