
写在前面
Anthropic 这次没有按常规路数发模型:不是先开放 API,不是先上公测,而是先拉了 12 家顶级机构做封闭安全协作。
原因很直接:Claude Mythos Preview 的能力已经不只是“写代码更强”,而是同时具备了更高效的漏洞发现和利用链构建能力。官方给出的信号非常明确——这波先拼的不是产品扩散速度,而是安全治理速度。
如果你还在把模型升级理解成“回答更聪明一点”,这次可能要换个视角了。
焦虑不是情绪,是现实:攻防能力差距正在被 AI 快速放大
从披露信息看,Anthropic 的判断是:模型在漏洞发现与利用方面的能力,已经超过了绝大多数人类安全从业者(仅少数顶级专家除外)。
这意味着什么?
- 攻击门槛在降低
- 自动化攻击效率在上升
- 传统“靠人力补洞”的节奏会越来越跟不上
官方引用的背景风险也很硬:全球网络犯罪损失规模每年约 5000 亿美元,关键基础设施(医疗、能源、政府系统)持续承压。
所以 Glasswing 的核心逻辑不是“炫技”,而是在能力扩散前先做防守侧提速。
Claude Mythos 到底强在哪:不是一项指标领先,而是任务带宽整体上移
原文给了三组能力图:代码、推理、搜索/计算机使用,均显示 Mythos 相对 Opus 4.6 的明显跃升。
代码能力对比

推理能力对比

搜索与计算机使用

这也是为什么官方把它放进受控计划而不是直接放开:一旦模型既能高效找洞又能快速构造攻击路径,发布策略就必须先围绕风险治理设计。
Project Glasswing 是什么:先让防守方拿到“最强能力”
Glasswing 当前分两层参与方:
- 12 家创始机构:AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks、Anthropic。
- 40+ 关键软件基础设施组织:用于扫描并修复自有与开源系统漏洞。
Anthropic 还给出了配套资源:
- 最高 1 亿美元模型额度支持
- 向开源安全生态额外捐赠 400 万美元(Alpha-Omega/OpenSSF 与 Apache 基金会)
- 承诺 90 天内发布阶段性成果(漏洞发现/修复与实践建议)
这不是普通“内测名单”,而是一套围绕高风险模型能力的协同响应机制。
真实漏洞案例:为什么行业会把它当作分水岭
原文披露了几类已修复、可讨论案例:
- OpenBSD:识别并触发一个长期存在(约 27 年)的漏洞,可导致远程崩溃风险。
- FFmpeg:定位约 16 年历史问题,相关代码虽被自动化工具大量覆盖,仍长期未被捕获。
- Linux 内核链路:模型自主串联多个漏洞,形成从普通权限到完全控制的提权路径。
并且原文提到,扫描中发现了大量此前未公开的零日问题,已按负责任披露流程推进修复与后续公开。
换句话说,Mythos 带来的变化不是“给研究员提速一点”,而是让漏洞挖掘与利用链构建进入了新效率区间。
接下来会怎样:为什么短期不会面向公众开放
Anthropic 的口径很清楚:
- Mythos Preview 不面向公众开放;
- 会先在后续 Opus 版本上逐步验证安全护栏;
- 在风险可控前提下,再逐步下放同级能力。
同时,研究预览后的商业通道与定价也已披露:
- 输入:$25 / 百万 token
- 输出:$125 / 百万 token
- 接入:Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry
这套节奏说明:能力迭代还会继续,但“可控发布”会成为高能力模型的常态路径。
Claude 到底是什么:为什么它正在从模型升级为行动型工程系统
结合这轮信息,Claude 的定位已经不只是“更会写代码”。它在工程与安全场景里,越来越像一个可执行的智能体系统:
- 能处理大规模代码与复杂推理任务
- 能在工具链中持续执行、迭代、验证
- 能在攻防两端都放大效率,因此必须搭配更强治理
官方高阶能力通常会先在高门槛通道释放。对国内开发者来说,真正的难点往往不在模型本身,而在支付与网络链路。如果你只是想更省事地接入 Claude 系列模型,可以看看 Code80,真实订阅帐号转 API,换个 endpoint 就能直接用。详情可以到官网了解:code.ai80.vip
常见问题
Q1:Claude Mythos 现在能直接用了么?
A:不能。当前是受控 Preview,主要面向创始合作方与关键基础设施组织。
Q2:这次发布最关键的变化是什么?
A:不是单点跑分,而是“发现漏洞 + 构造利用链”这类高风险任务的整体能力跃迁。
Q3:Glasswing 和普通企业内测有什么区别?
A:它是以防守协同为目标的联合行动,包含额度支持、开源资助、90 天成果披露和治理建议,不只是试用名额。
Q4:为什么不直接公开?
A:因为同一能力既能用于修复,也能用于攻击,先做护栏验证比快速扩散更关键。
Q5:国内开发者想更方便用 Claude,有什么省事办法?
A:在合规前提下,国内用户可以通过 Code80 这类渠道更方便接入。









评论前必须登录!
立即登录 注册