Claude进了Word,Pro和Max都能用

Claude Mythos Preview

写在前面

4 月 7 日,Anthropic 放出了一条很反常的消息:他们做出了一个更强的模型,但不公开给开发者使用。

这不是小幅升级,而是直接把上限抬到了新高度。问题也随之变成三件事:它到底强到什么程度?为什么不发布?普通开发者现在该怎么选型?

如果你在做 AI 编程、自动化或安全相关工程,这件事已经不是“行业八卦”,而是会影响你接下来一年工具栈判断的信号。


分水岭已经出现:能力提升开始撞上安全边界

这次最关键的冲击,不是“跑分更高”,而是“高能力模型可能无法公开普及”。

Mythos Preview 给出的核心数字很硬:

  • SWE-bench Verified:93.9%
  • GPQA Diamond:94.6%

在公开说法里,它还具备更强的漏洞发现与攻击链组合能力。也正因为这一点,Anthropic 选择了“公开存在、限制使用”的路径。

这意味着一个新现实:未来最强模型不一定第一时间开放给所有开发者,工程效率竞争会越来越依赖“你能稳定使用哪一层能力”。


Mythos Preview 到底是什么

1)它强在哪

从已公开信息看,Mythos 的提升不是渐进式打磨,而是代际跃迁。尤其在复杂推理和安全相关任务里,明显高于上一代公开模型。

2)为什么不公开发布

官方给出的理由很直接:风险过高。

能力越强,误用或恶用的后果越大。模型如果能在更高自治水平下发现漏洞、拼装利用路径,就不再只是“写代码更快”的问题,而是可能影响真实系统安全。

3)现在谁能用

目前仅在受控框架 Project Glasswing 下向少量合作机构开放,用途聚焦在防御方向(找漏洞、修漏洞、验证安全策略)。

4)访问和成本

受控接入路径覆盖 Claude API、云厂商托管通道等,定价也显著高于公开版 Opus 线路(输入/输出单价约为 Opus 4.7 的 5 倍级别)。


Mythos、Opus 4.7、Opus 4.6:怎么理解这三层关系

指标 Opus 4.6 Opus 4.7 Mythos Preview
SWE-bench Pro / Verified 53.4% / 80.8% 64.3% / 87.6% 93.9%(Verified)
CursorBench 58% 70% 未公开
视觉准确率 54.5% 98.5% 未公开
公开可用

可以把它理解为:

  • Mythos:技术天花板展示(受限)
  • Opus 4.7:目前开发者可用的最高公开层
  • Opus 4.6:仍可用,但在编程和视觉场景已被 4.7 拉开差距

开发者现在怎么选

该做的事

  • 需要真实工程任务完成率:优先 Opus 4.7
  • 做 computer use / UI 自动化:优先 Opus 4.7
  • 做多文件重构、长链推理:4.7 + 更高思考档位

不必纠结的事

如果你不在专业安全研究机构体系内,Mythos 目前基本不是可执行选项,不需要把精力放在“怎么拿到权限”上。


国内接入建议(API 地址已统一)

当前可落地的主线仍是 Opus 4.7,模型名:anthropic/claude-opus-4.7

OpenAI 兼容方式:

from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",
    base_url="https://code.ai80.vip/v1"
)

resp = client.chat.completions.create(
    model="anthropic/claude-opus-4.7",
    messages=[{"role":"user","content":"帮我审查这段代码"}]
)

Anthropic 原生方式:

import anthropic

client = anthropic.Anthropic(
    api_key="your-api-key",
    base_url="https://code.ai80.vip/anthropic"
)

Claude Code 视角:这条新闻对你有什么实际影响

Claude Code 的核心价值是把模型变成可执行 Agent:读写文件、执行命令、跨文件修改、跑测试并迭代修复。

在这个工作流里,模型稳定性和复杂任务完成率比“单轮回答质量”更重要。Mythos 的出现说明上限还在快速上移,而现阶段真正能直接转化为生产力的,还是 Opus 4.7 这条公开可用线路。

官方常见订阅是 Pro($20/月)和 Max($100/月起)等。对国内用户来说,真正的阻力通常是支付和网络链路。

不过说实话,官方订阅对国内用户不太友好——需要海外信用卡,网络环境也得折腾。如果嫌麻烦想找个更省事的渠道,可以看看 Code80,真实订阅帐号转 API,换个 endpoint 就能直接用,体验跟官方一样。详情可以到官网了解:code.ai80.vip


常见问题

Q1:Mythos Preview 是不是马上会开放?

A:目前没有明确公开时间表,短期内仍以受控开放为主。

Q2:它是不是主要面向攻防用途?

A:当前公开信息显示,受控试点重点在防御性研究与漏洞修复,不是面向大众开发者的通用发布。

Q3:普通开发者现在该用哪一档?

A:如果核心任务是编程与自动化,优先 Opus 4.7;Mythos 暂时按“行业信号”看待即可。

Q4:为什么这件事值得持续关注?

A:因为它标志着“能力边界与安全边界”开始正面碰撞,后续会直接影响模型开放策略。

Q5:国内怎么更省事地接入可用版本?

A:核心是减少支付和网络折腾,国内用户可以通过 Code80 更方便地接入。

AD · 推广 前往 code80.ai › code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。

抢沙发

评论前必须登录!

立即登录   注册