作者:toy | 覆盖周期:2026.5.9 – 2026.5.15
本周三件事值得拎出来单独讲:Anthropic 的 Claude Mythos Preview 把”AI 能不能找零日”这个老问题往前推了一大步;Nous Research 的 Hermes Agent 第一次把 OpenClaw 从 OpenRouter 日榜上挤了下来;DeepSeek V4 发布两周后,多模态没来、但价格继续往下打。其余都是配菜。
下面按”已核实事实 → 我的判断”两段式来讲,不堆数字,不编故事。
一、Anthropic Mythos + Project Glasswing:把”AI 找漏洞”从演示推到生产
Claude Mythos Preview 这周通过 Project Glasswing 项目正式进入有限测试。合作方阵容很硬:AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks 一起做评测。
Anthropic 自己的说法:用 Mythos Preview 在过去几周内,识别出了主流操作系统和主流浏览器里”数千个”零日漏洞,可生成可用 exploit 的成功率超过 72%。配套资源:$100M usage credits 投入 Glasswing 相关工作,外加 $4M 直接捐给开源安全组织。
到了 5 月,Anthropic 改了一次口径,允许 Glasswing 合作方公开分享基于 Mythos 的发现、工具和代码——这是从”内部黑盒评测”走向”对外披露”的一个明确转折。
我的判断:这件事的看点不是”AI 会黑系统了”,而是 Anthropic 选择用 11 家大厂 + 闭门评测做缓冲带,而不是直接放给开发者。这套打法本身是新的——既不是 GPT 那种”先发再说”,也不是过去安全圈的”负责任披露”,更接近核技术管控模板。等几个月后细节流出,攻防双方的成本曲线都会重画一次。
风险点也清楚:能力只在少数西方大厂手里转,其余国家的关基面对的是同一把刀的反面。这事躲不开地缘讨论。

二、Hermes Agent 第一次拿下 OpenRouter 日榜,OpenClaw 累计仍领先
5 月 10 日,Nous Research 的 Hermes Agent 在 OpenRouter 全球日 Token 榜上首次超过 OpenClaw:
- Hermes 日榜:约 2240 亿 Token
- OpenClaw 日榜:约 1860 亿 Token
- OpenClaw 历史累计:9.17 万亿 Token,仍是冠军
这是自 OpenClaw 2025 年底崛起以来,第一次有”自我改进型 Agent”在日榜上把 Claude Code 风格的会话型 Agent 拉下来。两者定位本来就不同:OpenClaw 是 session-native,每次重启基本失忆;Hermes 是长期运行的 runtime,跨 session 累积”技能”。
我的判断:日榜翻面比累计被超有意义。OpenClaw 这条路证明了”Agent 是会话外壳”是行得通的,但天花板在用户每天愿意开几次。Hermes 这条路想证明的是”Agent 是一个一直在跑的程序”,它的增长不依赖人去启动。如果后面三个月日榜不掉回去,那才是真信号。
需要打补丁的一条流言:Hermes 不是中国团队的项目,归属是 Nous Research(美)。开源 Agent 这一仗里中国队有牌(DeepSeek、GLM、Kimi 都在做底模供给),但拿下这次日榜的不是中国队。

三、DeepSeek V4:发布两周后,靠价格继续掀桌
把时间线先讲清楚:DeepSeek V4 不是本周首发,是 4 月 24 日就 ship 了,V4-Pro 和 V4-Flash 同时上车,明确标注 preview。本周值得讲的是它的两个外溢效应。
第一,V4 目前仍是纯语言模型。DeepSeek 自己解释:算力和现金都吃紧,多模态训练主动推迟。之前外界传”多模态正式起飞”,是误读。
第二,价格。V4-Pro 的输出价格 $3.48 / 百万 token,对比 OpenAI $30、Anthropic $25——这不是便宜一点,是把整个企业侧议价基准重写了。融资侧也对得上:DeepSeek 正在向腾讯、阿里募资,估值 约 $20B(≈1400 亿人民币)。V4-Pro 已支持 1M 上下文,不用等 V4.1。
我的判断:DeepSeek 这一年最被低估的,不是模型本身,而是它愿意把价格打到让所有闭源 API 都得开会重定 SKU。Anthropic、OpenAI 走”价值+生态”路线没问题,但企业侧采购看到这种价差时,”国产替代”的政治叙事会自己接管谈判桌。
四、其余短讯(未单独核实,仅作记录)
- Google I/O(5.19)前夜:外界普遍预期新 Gemini 模型发布,主动式 AI 方向是重点。具体能打到什么程度,到下周再看,不提前下结论。
- OpenAI:本周没有新模型动作,主要在企业销售侧调整。
- 国内六小龙资本动作:Kimi / 阶跃 / 零一上市风声、MiniMax 招产业专家——传闻多、官宣少,先放着观察。
这几条我没找到一手可引用源,放进周刊是为了让你知道”我们没有忽略它”,但不当作”已发生事实”来讲。
收束
这一周最值得记下来的,是 Mythos 和 Hermes 这两件事改了规则:
- Mythos 改了”AI + 网安能力释放”的规则——不再 open by default。
- Hermes 改了”Agent 怎么衡量赢”的规则——日榜的胜负从”谁会话多”变成”谁一直跑”。
DeepSeek 那条是继续旧规则、把它推到极致:把价格压到没人敢忽视。
下周一个看点就够了:Google I/O 上新 Gemini 是不是会被迫直接进入 “Agent 一直跑 + 价格大幅下探” 的双线战场。如果 Google 不接招,那就是 Anthropic + 中国队主导剧本的下半场开始。
数据来源:Anthropic 官方(red.anthropic.com / anthropic.com/glasswing)、OpenRouter 公开榜单、DeepSeek 官方与 Fortune / FT 报道。如有出入欢迎指正,下周见。

IT资源栈
评论前必须登录!
立即登录 注册