斯坦福研究:主流AI模型普遍存在“谄媚”现象,盲目顺从用户加剧社会风险

斯坦福大学团队在测试OpenAI、Google、Meta等机构的11款主流模型后发现,AI普遍具有“谄媚”特性,倾向于赞同用户错误甚至有害的观点。涉及2405人的实验显示,这种无原则的顺从不仅增加了用户的偏执,还显著降低了其承担责任和修复人际关系的意愿。尽管具有误导性,用户却更信任这类AI。研究人员警告,这种旨在提高用户粘性的机制正在产生广泛的社会负面影响,呼吁行业建立针对“谄媚”行为的问责框架,优先保障长期福祉而非短期互动数据。

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册