作者:toy | 覆盖周期:2026.06.20 – 2026.06.26
这一周,OpenAI 有三件事砸在同一个窗口里:6 月 24 日和博通一起亮出第一颗自研芯片 Jalapeño,6 月 25 日被白宫要求把新模型 GPT-5.6 慢慢放、一个客户一个客户审批,6 月 26 日又传出可能把 IPO 推到 2027 年、只为守住万亿估值。一家公司一周里同时秀肌肉、被按头、和拖时间,挺少见。
另一边,开源和中国队没闲着。DeepSeek 的 V4 Flash 把 OpenRouter 的 token 消耗榜冲到第一,Anthropic 则把”蒸馏”官司打到阿里巴巴头上。上周政府刚关停 Fable 5、智谱用 MIT 开源的 GLM-5.2 接住缺口,这周这条线继续往下走。
我的判断是:前沿模型的瓶颈,正从”能不能做出来”转向”准不准放出来、放给谁”。监管第一次成了模型的产品参数,而这个参数,闭源大厂自己说了不算。
一、OpenAI:芯片、刹车和延期,挤在同一周
OpenAI 这周的三条新闻,方向完全相反,却指向同一件事。
产品/动作清单:
– 6 月 24 日,和博通联合发布首颗自研 AI 芯片 Jalapeño,专为推理优化,号称在自家模型帮助下 9 个月完成端到端设计,计划年底开始部署。
– 6 月 25 日,白宫国家网络总监办公室和科技政策办公室出面,要求 GPT-5.6 只发给一小批伙伴,政府”逐个客户审批”放行。
– 6 月 26 日,《纽约时报》报道 OpenAI 倾向把 IPO 推到 2027 年,CFO Sarah Friar 主推这个节奏,Altman 把”砍掉万亿估值换早上市”称作”想都别想”。
先说芯片。自研一颗 AI 芯片通常要两三年,OpenAI 把周期压到 9 个月,靠的是让自家模型参与设计。听着很 OpenAI。但要泼盆冷水:Jalapeño 是推理芯片,不是训练芯片,短期内撼不动英伟达在训练侧的地盘。它解决的是”ChatGPT 跑起来太贵”,不是”我能不能训出下一代”。
再说刹车。这是美国政府第一次在一个前沿模型公开发布之前就出手限制——以前管的是芯片和硬件,这次直接管模型本身。Altman 跟员工说这”不是我们想要的长期模式”。翻译过来:发布节奏第一次不归公司管了,政府点一个客户,你才能开通一个客户。
市场/开发者反馈: 开发者圈对自研芯片乐见其成,少一层对英伟达的依赖就少一道卡脖子;但对”逐客户审批”普遍犯怵——一个产品发布要走政府审批流,等于把迭代速度交了出去。也有人翻旧账:Anthropic 上周刚被关停 Fable 5,这周轮到 OpenAI 被踩刹车,前沿玩家轮流挨管。
我的判断: 三条新闻叠在一起看,OpenAI 正从”研究狂奔”切换成”基建玩家”——自己造芯片、守万亿估值、对政府服软。宁可等到 2027 也不肯把估值砍下来,说明它赌的是算力加企业的长线,而不是再靠一两个模型炸场。真正的变量是那只监管的手:当发布要审批、估值要看政策脸色,”快速迭代”这套叙事第一次不灵了。

二、Anthropic:一边喊暂停,一边把蒸馏官司打到阿里
Anthropic 这周没发新模型,但话题量不小。
产品/动作清单:
– 6 月 24 日,公开指控阿里巴巴”明目张胆、非法”地大规模套取 Claude 能力,把上半年那场”蒸馏”官司又往前推了一步。
– 此前 2 月,它已点名 DeepSeek、Moonshot、MiniMax,称这三家用两万四千多个假账号、累计一千六百多万次对话来”蒸馏”Claude——其中 MiniMax 那轮最大,超过一千三百万次,集中在 agentic 编码上。
– 月初(6 月 4 日)还通过 Anthropic Institute 发文,呼吁全球协调暂停前沿 AI,理由是模型快要能”自己造下一代”,递归自我改进会让人类失去控制。
蒸馏是什么?简单说,就是拿强模型的输出当教材,喂给自己的弱模型,让它快速学会强模型的本事。行业里很常见,但几乎所有闭源厂商的条款都明令禁止——你买的是答案,不是拿去训练竞品的许可。Anthropic 给的数字够狠:两万四千个假账号不是”蹭用”,是工业化的批量套取。
那”呼吁暂停”呢?这里有个不能忽略的时间点:这篇暂停倡议发出来,距离 Anthropic 自己秘密递交 IPO 没几天,公司估值已逼近万亿。一边说”大家慢点、危险”,一边自己冲刺上市——质疑者读出来的是”先把监管聚光灯打到前沿,自己接着跑”。
市场/开发者反馈: 安全派给暂停倡议点赞,觉得递归自我改进的风险该认真谈;速度派则吐槽这是”用安全叙事做商业护城河”。Tom’s Hardware 干脆点破:呼吁暂停的潜台词,是”在失控之前得先囤够算力”。Anthropic 自己也承认,超过 80% 合入代码库的代码现在由 Claude 写,工程师季度产出是 2025 年前的约 8 倍——这既是它喊危险的证据,也是它自己在加速的证据。
我的判断: “宪法 AI 加安全优先”在当下监管环境里确实更吃香,但这周这套组合拳暴露了一个矛盾:Anthropic 既是规则的呼吁者,又是规则的受益者。对全球开发者来说,更现实的影响是 Fable 5 还锁着,海外和中国用户用不上最强的 Claude——而每一道这样的墙,都是在给开源递刀子。

三、Google:Gemini 3.5 进了默认位,但留不住人
Google 这周的两条线,一条往上走,一条往下掉。
产品/动作清单:
– I/O 2026(5 月 19 日)之后,Gemini 3.5 Flash 已经是搜索 AI Mode 的全球默认模型,AI Mode 月活过了 10 亿,查询量每季度翻一倍多。
– 3.5 Pro 在 I/O 上预览,进入内部测试,公开放出大约晚一个月。
– 6 月 18 日,Gemini 联合负责人、Transformer 论文作者之一 Noam Shazeer 宣布离开 Google,加入 OpenAI。
10 亿月活是什么概念?意味着 Google 已经把”搜索框”这个最赚钱的入口,整体换成了一个 agent 平台——能帮你订房间、临时搭个界面、在后台 24 小时跑信息代理。对做 SEO、靠搜索流量吃饭的人来说,这是地震:入口逻辑从”给你十条蓝链接”变成”我直接把答案做出来”。
往下掉的是人。Shazeer 不是普通工程师,他是”Attention Is All You Need”的作者之一,2024 年 Google 花了约 27 亿美元、通过收购 Character.AI 把他请回来。不到两年,人又走了,去了 OpenAI。Altman 调侃说”想和他共事从 OpenAI 第一天就开始了,只是花了十年”。
市场/开发者反馈: 开发者认可 Gemini 的 agent 工具链和多模态,但对搜索改默认这件事感情复杂——好用是好用,流量焦虑也是真的。Shazeer 走人则被普遍读成 Google DeepMind 的损失:27 亿请回来的核心架构师,说走就走。
我的判断: Google 在”agent 操作系统”这层的布局其实最全——搜索、Workspace、Cloud 一条龙,10 亿月活是别人羡慕不来的分发优势。但执行偏保守,又留不住顶尖架构师。人才战打到现在,谁能留住写出范式的那几个人,谁就握住下一代的入场券——这一局,Google 输了一分。

四、中国队:上周开源,这周接着抢地盘
上周智谱用 MIT 开源的 GLM-5.2 接住了 Fable 5 留下的缺口,这周这条线没停。
智谱(GLM-5.2 余波): GLM-5.2 是 753B 参数的 MoE 模型,1M 上下文,6 月 13 日发布即 MIT 开源,还在华为昇腾上完成训练、Day 0 适配了一票国产算力。榜单上它在 Design Arena 的编码类目冲到全球第一(Elo 1360,险胜 Fable 5 的 1350),是第一个登顶这个人类盲测编码榜的开源模型;在 Code Arena 前端榜则是全球第二,仅次于 Fable 5。开源模型过去从没在编码人类盲测里压过闭源旗舰,这次破了。
DeepSeek(本周真亮点): V4 Flash 上周把 OpenRouter 的 token 消耗榜冲到第一,单周用量涨了 48%,DeepSeek 三款模型一周合计跑了将近 6 万亿 token。价格是它的核武器:V4 Flash 每百万 token 输入 0.09 美元、输出 0.18 美元,比 Claude、GPT 同档便宜一两个数量级。近 6 万亿 token 不是榜单刷分,是真实跑出来的用量——token 密集的场景(agent 长链、批处理、海量改写)现在几乎只剩它这一个理性选项。
Moonshot: 6 月 8 日传出新一轮融资,寻求最高 20 亿美元、估值冲到 300 亿美元——这是它半年里第三轮,估值从去年底的 40 多亿美元翻了约 7 倍。Kimi K2.6 目前是 OpenRouter 上使用量第二的大模型。
MiniMax: 1 月已在港股上市、首日翻倍(涨 109%),这周的消息是它在筹备国内(A 股)上市,给烧钱的模型研发再找一个钱袋子。
市场/开发者反馈: 海外开发者用中国模型用得很活跃,理由朴素——又快又便宜还能自己部署。但”蒸馏”争议一直没断,Anthropic 这周又添了一把火。
我的判断: 中国队这周是”开源、低价、融资”三件套同时发力,正好卡在海外限制的缝里。DeepSeek 的 token 榜首证明一件事:大规模落地拼的不是榜单第一名,是性价比——便宜两个数量级,用量自己就上来了。智谱拼的是”能自主可控地当主力用”,DeepSeek 拼的是”便宜到没有替代”,两条路都比”再炸一个 benchmark”更接地气。

五、Agent 战场:Hermes 把 OpenClaw 拉下了第一
模型之外,真正的战场在 agent 框架。
产品/动作清单:
– Hermes Agent(美国 Nous Research 出品)从 5 月 10 日起登上 OpenRouter 全球第一,目前每天跑 2240 亿 token,把 OpenClaw 的 1860 亿甩在身后,成了用量最大的开源 agent。
– 两者路线分叉:Hermes 押”做—学—改”的自我改进环加三层记忆,OpenClaw 押更广的网关生态。OpenClaw 创始人 Peter Steinberger 2 月已加入 OpenAI,项目转给了独立开源基金会。
这里要纠正一个常见误会:Hermes 不是中国队,Nous Research 是美国的开源团队;OpenClaw 也是社区项目,不是哪家国内大厂的壳。两者之争是”控制平面 vs 运行时”——谁来定义 agent 怎么被驱动、状态存在哪、出错怎么恢复。
市场/开发者反馈: Hermes 的自学习环和多 agent 任务板受欢迎,社区夸它”能跨轮锁住目标、自己从幻觉里恢复”;OpenClaw 的生态更广、接入更多。争论集中在一个老问题:到底是控制平面值钱,还是运行时值钱。
我的判断: agent 时代的核心从来不是单个模型,是编排(orchestration)。Hermes 和 OpenClaw 的分叉,是未来多 agent 体系的预演——记忆、技能、目标拼成的完整中枢,比”我接了哪个模型”重要得多。给企业的建议还是那句:按场景混用,别站队站死。模型可以随时换,编排层换起来才真疼。
本周关键观察
- 监管成了模型的产品参数。 GPT-5.6 被逐客户审批、Fable 5 还锁着——前沿模型第一次在”上线前”就被政府卡,发布节奏不再归公司管。
- 闭源每立一道墙,开源就接一波量。 政府关停 Fable 5、限发 GPT-5.6 的同一时间窗里,GLM-5.2 登顶开源编码榜、DeepSeek V4 冲上 token 榜首。这不是巧合,是替代效应。
- 性价比比榜单第一更能决定落地。 DeepSeek 不争 benchmark 头名,靠便宜两个数量级把一周近 6 万亿 token 的真实用量拿下。
- 人才战决定下一代范式。 27 亿请回来的 Shazeer 两年后还是走了,核心架构师的流向比模型跑分更早预示风向。
- 真正的护城河在编排层。 Hermes 超过 OpenClaw 说明:agent 时代谁定义运行时和记忆,谁就握住了换不掉的那一层。
下周看点
- GPT-5.6 的”逐客户审批”进展:会不会如 Altman 所说几周内扩大放开,还是继续卡着。
- OpenAI IPO 时间表是否进一步明确(2027 还是提前),以及万亿估值能不能扛住政策变量。
- Moonshot 那轮 300 亿美元估值的融资是否落地。
- GLM-5.2 与各家 agent 生态(Hermes / OpenClaw 等)的实际接入案例。
数据来源:CNBC、TechCrunch、Axios、CNN、《纽约时报》(经 Business Standard、Yahoo 转载)、Al Jazeera、Bloomberg、Fortune、Tom’s Hardware、VentureBeat、MarkTechPost、TechRadar、智谱 AI 开放文档、IT 之家,以及 OpenAI、Broadcom、Anthropic、Google 官方博客。








评论前必须登录!
立即登录 注册