Anthropic 今天发布了 Claude Opus 4.8。价格没变,跑分照常往上走,这本来是一次很常规的小版本升级。但发布稿里花了不小的篇幅讲一件事:这个模型更”诚实”了。
诚实度被拿出来当主打,这是个值得留意的信号。过去模型迭代讲的是能力天花板,现在开始讲”它会不会糊弄你”。
先把事实摆出来
Opus 4.8 是 Opus 4.7 的升级版,API 标识 claude-opus-4-8,即时可用。价格和上一代完全一样:输入每百万 token 5 美元,输出 25 美元。
能力上是全面小涨:编码、agentic、推理、知识工作都比 4.7 强。几个具体数字:
- Online-Mind2Web(浏览器代理基准)拿到 84%
- Legal Agent Benchmark 历史最高分
- Super-Agent 基准上是唯一端到端跑完全部 case 的模型
这些是常规迭代该有的样子。真正不一样的是下面这条。
诚实度:漏判缺陷的概率降到四分之一
官方说,Opus 4.8 放过代码缺陷、让问题无声通过的概率,大约是 Opus 4.7 的四分之一。换句话说,你让它 review 代码,它”看到了但不吭声”的情况少了四倍。
这件事的分量,得放到 Anthropic 自己之前的判断里看。
他们早些时候讲过一个瓶颈:编码本身已经被 AI 大幅加速了,但安全、code review、设计质量这些”不可验证”的能力还没跟上。一句话——训练效率正比于验证的难易程度。容易打分的能力涨得快,不容易打分的能力是新的天花板。
“诚实”恰好就是最难验证的那一类。模型给你一段代码,你怎么知道它是真没发现问题,还是发现了懒得说。它说”没问题”,你得自己再查一遍才能确认。这种地方,模型糊弄你的成本几乎为零,你核对的成本却很高。
所以把漏判率往下压,比再多两个百分点的跑分有用得多。
Agent 越自动,这件事越要命
为什么现在才把诚实度顶到台面上。我的理解是,跟 agent 化直接相关。
模型只回答一个问题的时候,你能看着它的输出。可一旦它开始连着跑几十步、改几百个文件,你没法盯每一步。这时候它在中间某一步”差不多就行了”地放过一个问题,最后你拿到的就是一个看起来完成、实际有坑的结果。
步骤越长,人越看不过来,模型的”老实程度”就越是整条链路的真实可靠性来源。这不是道德问题,是工程问题。
Opus 4.8 这次配套放出来的几个东西,也都在往”更长链路”推:
- Dynamic Workflows:Claude Code 里的新功能,研究预览阶段,限企业版和 Team、Max 计划。让多个子代理并行干活,目标是数十万行代码级别的大规模迁移。
- Effort Control:claude.ai 和 Cowork 上线了努力程度调节,质量、速度、额度消耗之间自己权衡。模型默认 high,难任务可以手动调到 extra 或 max。
- Messages API 现在允许在消息数组中间插入 system 条目,任务跑到一半改指令不会打断 prompt 缓存。
链路拉得越长,越需要模型在你看不见的环节别偷工。诚实度和这些功能是配套的,不是各讲各的。

顺便提一句价格
Fast Mode 这次降得明显:每百万 token 输入 10 美元、输出 50 美元,2.5 倍速度,价格只有上一代 fast 模式的三分之一。常规档没动。
对自己跑量的人来说,fast 档降价比模型升级更实在。
接下来
官方预告了三件事:一个能力接近 Opus 但成本更低的模型;一个智能高于 Opus 的新模型类别;还有 Mythos Preview——目前限在网络安全场景部署,未来几周会扩大可用范围。
我猜这两天其他家也会有动作,发布节奏一向是你追我赶(这只是我的猜测,没有信源)。但对用 Claude 干活的人来说,对标谁不重要,重要的是手里这个工具又稳了一点。
我会怎么用
如果你拿 Opus 做代码审查,4.8 值得直接换上去——漏判率降四倍,是实打实能省事的地方。但别因为它”更诚实”就把人工那道兜底全撤了。模型少骗你,不等于不会错。验证这道关,还是得自己守着。
就这些。
—— toy

IT资源栈
评论前必须登录!
立即登录 注册