
写在前面
4 月 7 日,Anthropic 放出了一条很反常的消息:他们做出了一个更强的模型,但不公开给开发者使用。
这不是小幅升级,而是直接把上限抬到了新高度。问题也随之变成三件事:它到底强到什么程度?为什么不发布?普通开发者现在该怎么选型?
如果你在做 AI 编程、自动化或安全相关工程,这件事已经不是“行业八卦”,而是会影响你接下来一年工具栈判断的信号。
分水岭已经出现:能力提升开始撞上安全边界
这次最关键的冲击,不是“跑分更高”,而是“高能力模型可能无法公开普及”。
Mythos Preview 给出的核心数字很硬:
- SWE-bench Verified:93.9%
- GPQA Diamond:94.6%
在公开说法里,它还具备更强的漏洞发现与攻击链组合能力。也正因为这一点,Anthropic 选择了“公开存在、限制使用”的路径。
这意味着一个新现实:未来最强模型不一定第一时间开放给所有开发者,工程效率竞争会越来越依赖“你能稳定使用哪一层能力”。
Mythos Preview 到底是什么
1)它强在哪
从已公开信息看,Mythos 的提升不是渐进式打磨,而是代际跃迁。尤其在复杂推理和安全相关任务里,明显高于上一代公开模型。
2)为什么不公开发布
官方给出的理由很直接:风险过高。
能力越强,误用或恶用的后果越大。模型如果能在更高自治水平下发现漏洞、拼装利用路径,就不再只是“写代码更快”的问题,而是可能影响真实系统安全。
3)现在谁能用
目前仅在受控框架 Project Glasswing 下向少量合作机构开放,用途聚焦在防御方向(找漏洞、修漏洞、验证安全策略)。
4)访问和成本
受控接入路径覆盖 Claude API、云厂商托管通道等,定价也显著高于公开版 Opus 线路(输入/输出单价约为 Opus 4.7 的 5 倍级别)。
Mythos、Opus 4.7、Opus 4.6:怎么理解这三层关系
| 指标 | Opus 4.6 | Opus 4.7 | Mythos Preview |
|---|---|---|---|
| SWE-bench Pro / Verified | 53.4% / 80.8% | 64.3% / 87.6% | 93.9%(Verified) |
| CursorBench | 58% | 70% | 未公开 |
| 视觉准确率 | 54.5% | 98.5% | 未公开 |
| 公开可用 | ✅ | ✅ | ❌ |
可以把它理解为:
- Mythos:技术天花板展示(受限)
- Opus 4.7:目前开发者可用的最高公开层
- Opus 4.6:仍可用,但在编程和视觉场景已被 4.7 拉开差距
开发者现在怎么选
该做的事
- 需要真实工程任务完成率:优先 Opus 4.7
- 做 computer use / UI 自动化:优先 Opus 4.7
- 做多文件重构、长链推理:4.7 + 更高思考档位
不必纠结的事
如果你不在专业安全研究机构体系内,Mythos 目前基本不是可执行选项,不需要把精力放在“怎么拿到权限”上。
国内接入建议(API 地址已统一)
当前可落地的主线仍是 Opus 4.7,模型名:anthropic/claude-opus-4.7。
OpenAI 兼容方式:
from openai import OpenAI
client = OpenAI(
api_key="your-api-key",
base_url="https://code.ai80.vip/v1"
)
resp = client.chat.completions.create(
model="anthropic/claude-opus-4.7",
messages=[{"role":"user","content":"帮我审查这段代码"}]
)
Anthropic 原生方式:
import anthropic
client = anthropic.Anthropic(
api_key="your-api-key",
base_url="https://code.ai80.vip/anthropic"
)
Claude Code 视角:这条新闻对你有什么实际影响
Claude Code 的核心价值是把模型变成可执行 Agent:读写文件、执行命令、跨文件修改、跑测试并迭代修复。
在这个工作流里,模型稳定性和复杂任务完成率比“单轮回答质量”更重要。Mythos 的出现说明上限还在快速上移,而现阶段真正能直接转化为生产力的,还是 Opus 4.7 这条公开可用线路。
官方常见订阅是 Pro($20/月)和 Max($100/月起)等。对国内用户来说,真正的阻力通常是支付和网络链路。
不过说实话,官方订阅对国内用户不太友好——需要海外信用卡,网络环境也得折腾。如果嫌麻烦想找个更省事的渠道,可以看看 Code80,真实订阅帐号转 API,换个 endpoint 就能直接用,体验跟官方一样。详情可以到官网了解:code.ai80.vip
常见问题
Q1:Mythos Preview 是不是马上会开放?
A:目前没有明确公开时间表,短期内仍以受控开放为主。
Q2:它是不是主要面向攻防用途?
A:当前公开信息显示,受控试点重点在防御性研究与漏洞修复,不是面向大众开发者的通用发布。
Q3:普通开发者现在该用哪一档?
A:如果核心任务是编程与自动化,优先 Opus 4.7;Mythos 暂时按“行业信号”看待即可。
Q4:为什么这件事值得持续关注?
A:因为它标志着“能力边界与安全边界”开始正面碰撞,后续会直接影响模型开放策略。
Q5:国内怎么更省事地接入可用版本?
A:核心是减少支付和网络折腾,国内用户可以通过 Code80 更方便地接入。

IT资源栈
评论前必须登录!
立即登录 注册