近期,在技术社区 Linux.do 上,关于 Claude AI 模型出现“降智”现象的讨论引发热议。多位用户反馈,最新版本的 Claude 表现出明显的“反向优化”倾向:面对复杂或简单问题时,模型往往陷入过度道歉,拒绝执行指令,甚至表现出逻辑能力的退化。这一现象被普遍认为是由于过度强化安全过滤(RLHF)导致的“对齐税”效应。开发者们在追求 AI 安全合规的同时,似乎正面临着牺牲模型实用性与创造力的两难困境,引发了对 AI 发展方向的深层反思。
原文链接:Linux.do
近期,在技术社区 Linux.do 上,关于 Claude AI 模型出现“降智”现象的讨论引发热议。多位用户反馈,最新版本的 Claude 表现出明显的“反向优化”倾向:面对复杂或简单问题时,模型往往陷入过度道歉,拒绝执行指令,甚至表现出逻辑能力的退化。这一现象被普遍认为是由于过度强化安全过滤(RLHF)导致的“对齐税”效应。开发者们在追求 AI 安全合规的同时,似乎正面临着牺牲模型实用性与创造力的两难困境,引发了对 AI 发展方向的深层反思。
原文链接:Linux.do
评论前必须登录!
立即登录 注册