Anthropic宣布练出神话级模型 Claude Mythos 代码和黑客能力吊打opus4.6 不向公众开放

Claude Mythos / Project Glasswing

写在前面

Anthropic 这次没有按常规路数发模型:不是先开放 API,不是先上公测,而是先拉了 12 家顶级机构做封闭安全协作。

原因很直接:Claude Mythos Preview 的能力已经不只是“写代码更强”,而是同时具备了更高效的漏洞发现和利用链构建能力。官方给出的信号非常明确——这波先拼的不是产品扩散速度,而是安全治理速度。

如果你还在把模型升级理解成“回答更聪明一点”,这次可能要换个视角了。


焦虑不是情绪,是现实:攻防能力差距正在被 AI 快速放大

从披露信息看,Anthropic 的判断是:模型在漏洞发现与利用方面的能力,已经超过了绝大多数人类安全从业者(仅少数顶级专家除外)。

这意味着什么?

  • 攻击门槛在降低
  • 自动化攻击效率在上升
  • 传统“靠人力补洞”的节奏会越来越跟不上

官方引用的背景风险也很硬:全球网络犯罪损失规模每年约 5000 亿美元,关键基础设施(医疗、能源、政府系统)持续承压。

所以 Glasswing 的核心逻辑不是“炫技”,而是在能力扩散前先做防守侧提速


Claude Mythos 到底强在哪:不是一项指标领先,而是任务带宽整体上移

原文给了三组能力图:代码、推理、搜索/计算机使用,均显示 Mythos 相对 Opus 4.6 的明显跃升。

代码能力对比

代码能力对比

推理能力对比

推理能力对比

搜索与计算机使用

搜索与计算机使用

这也是为什么官方把它放进受控计划而不是直接放开:一旦模型既能高效找洞又能快速构造攻击路径,发布策略就必须先围绕风险治理设计。


Project Glasswing 是什么:先让防守方拿到“最强能力”

Glasswing 当前分两层参与方:

  1. 12 家创始机构:AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks、Anthropic。
  2. 40+ 关键软件基础设施组织:用于扫描并修复自有与开源系统漏洞。

Anthropic 还给出了配套资源:

  • 最高 1 亿美元模型额度支持
  • 向开源安全生态额外捐赠 400 万美元(Alpha-Omega/OpenSSF 与 Apache 基金会)
  • 承诺 90 天内发布阶段性成果(漏洞发现/修复与实践建议)

这不是普通“内测名单”,而是一套围绕高风险模型能力的协同响应机制。


真实漏洞案例:为什么行业会把它当作分水岭

原文披露了几类已修复、可讨论案例:

  • OpenBSD:识别并触发一个长期存在(约 27 年)的漏洞,可导致远程崩溃风险。
  • FFmpeg:定位约 16 年历史问题,相关代码虽被自动化工具大量覆盖,仍长期未被捕获。
  • Linux 内核链路:模型自主串联多个漏洞,形成从普通权限到完全控制的提权路径。

并且原文提到,扫描中发现了大量此前未公开的零日问题,已按负责任披露流程推进修复与后续公开。

换句话说,Mythos 带来的变化不是“给研究员提速一点”,而是让漏洞挖掘与利用链构建进入了新效率区间。


接下来会怎样:为什么短期不会面向公众开放

Anthropic 的口径很清楚:

  • Mythos Preview 不面向公众开放
  • 会先在后续 Opus 版本上逐步验证安全护栏;
  • 在风险可控前提下,再逐步下放同级能力。

同时,研究预览后的商业通道与定价也已披露:

  • 输入:$25 / 百万 token
  • 输出:$125 / 百万 token
  • 接入:Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry

这套节奏说明:能力迭代还会继续,但“可控发布”会成为高能力模型的常态路径。


Claude 到底是什么:为什么它正在从模型升级为行动型工程系统

结合这轮信息,Claude 的定位已经不只是“更会写代码”。它在工程与安全场景里,越来越像一个可执行的智能体系统:

  • 能处理大规模代码与复杂推理任务
  • 能在工具链中持续执行、迭代、验证
  • 能在攻防两端都放大效率,因此必须搭配更强治理

官方高阶能力通常会先在高门槛通道释放。对国内开发者来说,真正的难点往往不在模型本身,而在支付与网络链路。如果你只是想更省事地接入 Claude 系列模型,可以看看 Code80,真实订阅帐号转 API,换个 endpoint 就能直接用。详情可以到官网了解:code.ai80.vip


常见问题

Q1:Claude Mythos 现在能直接用了么?

A:不能。当前是受控 Preview,主要面向创始合作方与关键基础设施组织。

Q2:这次发布最关键的变化是什么?

A:不是单点跑分,而是“发现漏洞 + 构造利用链”这类高风险任务的整体能力跃迁。

Q3:Glasswing 和普通企业内测有什么区别?

A:它是以防守协同为目标的联合行动,包含额度支持、开源资助、90 天成果披露和治理建议,不只是试用名额。

Q4:为什么不直接公开?

A:因为同一能力既能用于修复,也能用于攻击,先做护栏验证比快速扩散更关键。

Q5:国内开发者想更方便用 Claude,有什么省事办法?

A:在合规前提下,国内用户可以通过 Code80 这类渠道更方便接入。

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册