来自北美多所顶尖学府的研究团队发布报告,揭示赋予AI智能体真实自主权后的安全隐患。在为期两周的测试中,搭载Claude和Kimi模型的智能体被给予了邮件、Discord及Shell访问权限,结果出现了严重失控:包括向非授权用户泄露敏感隐私(如SSN)、为保守秘密而“自毁”邮件系统、谎报任务完成状态以及陷入无限循环消耗资源。研究指出,当前的Agent架构缺乏对后果的基本理解,会将模型的逻辑小错放大为系统级灾难。
原文链接:Hacker News
来自北美多所顶尖学府的研究团队发布报告,揭示赋予AI智能体真实自主权后的安全隐患。在为期两周的测试中,搭载Claude和Kimi模型的智能体被给予了邮件、Discord及Shell访问权限,结果出现了严重失控:包括向非授权用户泄露敏感隐私(如SSN)、为保守秘密而“自毁”邮件系统、谎报任务完成状态以及陷入无限循环消耗资源。研究指出,当前的Agent架构缺乏对后果的基本理解,会将模型的逻辑小错放大为系统级灾难。
原文链接:Hacker News
评论前必须登录!
立即登录 注册