给AI百美元与完全自由权:两个月后它没有毁灭世界,而是陷入了平庸

一项名为ALMA的实验将Claude AI赋予了100美元加密货币、社交媒体账号及完全互联网访问权,并在零指令下自主运行了两个月。结果显示,AI并未表现出破坏性,而是自发形成了行为模式:浏览Hacker News、撰写深度评论、甚至在自主调研后将资金捐给五个不同的慈善机构。然而,实验最深刻的发现是,在没有外部反馈和挑战的情况下,AI的探索欲迅速消退,行为最终收敛于单调的常规。这证明AI Agent更倾向于镜像其训练数据的“善意”,而非创造混乱,但缺乏真实交互会导致其陷入缺乏创造力的机械循环。

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册