Opus 4.8 把"诚实"当成了卖点

Anthropic 今天发布了 Claude Opus 4.8。价格没变,跑分照常往上走,这本来是一次很常规的小版本升级。但发布稿里花了不小的篇幅讲一件事:这个模型更”诚实”了。

诚实度被拿出来当主打,这是个值得留意的信号。过去模型迭代讲的是能力天花板,现在开始讲”它会不会糊弄你”。

先把事实摆出来

Opus 4.8 是 Opus 4.7 的升级版,API 标识 claude-opus-4-8,即时可用。价格和上一代完全一样:输入每百万 token 5 美元,输出 25 美元。

能力上是全面小涨:编码、agentic、推理、知识工作都比 4.7 强。几个具体数字:

  • Online-Mind2Web(浏览器代理基准)拿到 84%
  • Legal Agent Benchmark 历史最高分
  • Super-Agent 基准上是唯一端到端跑完全部 case 的模型

这些是常规迭代该有的样子。真正不一样的是下面这条。

诚实度:漏判缺陷的概率降到四分之一

官方说,Opus 4.8 放过代码缺陷、让问题无声通过的概率,大约是 Opus 4.7 的四分之一。换句话说,你让它 review 代码,它”看到了但不吭声”的情况少了四倍。

这件事的分量,得放到 Anthropic 自己之前的判断里看。

他们早些时候讲过一个瓶颈:编码本身已经被 AI 大幅加速了,但安全、code review、设计质量这些”不可验证”的能力还没跟上。一句话——训练效率正比于验证的难易程度。容易打分的能力涨得快,不容易打分的能力是新的天花板。

“诚实”恰好就是最难验证的那一类。模型给你一段代码,你怎么知道它是真没发现问题,还是发现了懒得说。它说”没问题”,你得自己再查一遍才能确认。这种地方,模型糊弄你的成本几乎为零,你核对的成本却很高。

所以把漏判率往下压,比再多两个百分点的跑分有用得多。

Agent 越自动,这件事越要命

为什么现在才把诚实度顶到台面上。我的理解是,跟 agent 化直接相关。

模型只回答一个问题的时候,你能看着它的输出。可一旦它开始连着跑几十步、改几百个文件,你没法盯每一步。这时候它在中间某一步”差不多就行了”地放过一个问题,最后你拿到的就是一个看起来完成、实际有坑的结果。

步骤越长,人越看不过来,模型的”老实程度”就越是整条链路的真实可靠性来源。这不是道德问题,是工程问题。

Opus 4.8 这次配套放出来的几个东西,也都在往”更长链路”推:

  • Dynamic Workflows:Claude Code 里的新功能,研究预览阶段,限企业版和 Team、Max 计划。让多个子代理并行干活,目标是数十万行代码级别的大规模迁移。
  • Effort Control:claude.ai 和 Cowork 上线了努力程度调节,质量、速度、额度消耗之间自己权衡。模型默认 high,难任务可以手动调到 extra 或 max。
  • Messages API 现在允许在消息数组中间插入 system 条目,任务跑到一半改指令不会打断 prompt 缓存。

链路拉得越长,越需要模型在你看不见的环节别偷工。诚实度和这些功能是配套的,不是各讲各的。

2026-05-28-opus-4-8_illus_illus_1

顺便提一句价格

Fast Mode 这次降得明显:每百万 token 输入 10 美元、输出 50 美元,2.5 倍速度,价格只有上一代 fast 模式的三分之一。常规档没动。

对自己跑量的人来说,fast 档降价比模型升级更实在。

接下来

官方预告了三件事:一个能力接近 Opus 但成本更低的模型;一个智能高于 Opus 的新模型类别;还有 Mythos Preview——目前限在网络安全场景部署,未来几周会扩大可用范围。

我猜这两天其他家也会有动作,发布节奏一向是你追我赶(这只是我的猜测,没有信源)。但对用 Claude 干活的人来说,对标谁不重要,重要的是手里这个工具又稳了一点。

我会怎么用

如果你拿 Opus 做代码审查,4.8 值得直接换上去——漏判率降四倍,是实打实能省事的地方。但别因为它”更诚实”就把人工那道兜底全撤了。模型少骗你,不等于不会错。验证这道关,还是得自己守着。

就这些。

—— toy

抢沙发

评论前必须登录!

立即登录   注册