Cloudflare 通过“Project Glasswing”项目,在自家基础设施上对 Anthropic 开发的 Mythos Preview 模型进行了深度测试。该模型代表了通用 LLM 在安全领域的显著飞跃,其核心突破在于能够将多个低风险漏洞组合成完整的攻击利用链,并自动编写、编译及运行代码以验证漏洞的可利用性,其推理能力接近资深安全研究员。然而,测试也揭示了模型在应用中的挑战:包括在合法研究中的非一致性拒绝行为,以及在海量代码扫描中产生的高噪声和虚假报告问题。研究指出,直接使用通用的编程 Agent 无法有效应对大型代码库,因为上下文窗口限制和单线程处理模式无法覆盖复杂的攻击面。为此,Cloudflare 构建了一套自动化的漏洞挖掘框架,包含侦察、狩猎、验证、填补空白、去重、追踪和反馈七个阶段。通过并行处理窄范围任务、引入对抗性 Agent 进行降噪以及交叉仓库符号索引,该系统显著提高了漏洞发现的准确率和覆盖率。文章结论强调,仅靠加快修补速度不足以应对未来的威胁,安全团队必须转向纵深防御架构,并利用此类 AI 框架来压缩漏洞响应周期。
事件分析
本次测试展示了 LLM 从单纯的代码生成向具备复杂逻辑推理和自主验证能力的“Cyber Agent”演进。Mythos 最核心的技术突破在于“漏洞利用链构建”,即能独立完成从发现内存破坏基元到组合 ROP 链的全过程,这意味着 AI 不仅仅是辅助工具,而是开始具备独立完成高级渗透测试任务的潜力。Cloudflare 提出的多 Agent 并行协作框架比模型本身更具参考价值,它解决了单 Agent 在处理大规模代码库时的“注意力涣散”问题,通过引入对抗性验证和状态机化的反馈闭环,将大模型从“聊天机器人”模式转变为工业级的自动化审计流水线。这预示着网络安全防御的范式转移,未来的安全运营将不再是人与漏洞的竞速,而是 AI 自动化审计系统与 AI 攻击工具的博弈。
💡 核心观点:AI 安全进入实战化阶段,胜负手已从单点模型能力转向构建多 Agent 编排的自动化防御体系。
原文链接:Hacker News

IT资源栈
评论前必须登录!
立即登录 注册