社区热议 Claude 模型“降智”:过度对齐致只会道歉,用户体验引发担忧

近期,在技术社区 Linux.do 上,关于 Claude AI 模型出现“降智”现象的讨论引发热议。多位用户反馈,最新版本的 Claude 表现出明显的“反向优化”倾向:面对复杂或简单问题时,模型往往陷入过度道歉,拒绝执行指令,甚至表现出逻辑能力的退化。这一现象被普遍认为是由于过度强化安全过滤(RLHF)导致的“对齐税”效应。开发者们在追求 AI 安全合规的同时,似乎正面临着牺牲模型实用性与创造力的两难困境,引发了对 AI 发展方向的深层反思。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册