GPT‑5.1 Codex Max 的 原生上下文压缩 是如何实现的?

AI工具导航站
同名“AI工具导航站”,跟上时代的脚步
14 人赞同了该回答
简单说:GPT-5.1-Codex-Max 的「原生上下文压缩」本质上就是 Compaction——当上下文窗口快被塞满时,模型会主动把”历史对话 和关键产物”压缩成一个更短但信息密度更高的状态,然后用这个状态开启新窗口继续干活。
这样循环往复,最终实现单任务跨多个 context window、总计覆盖百万级 token。
根据已公开的信息,整个压缩机制大概是这样运作的:
1.会话历史不丢,但”喂给模型的上下文”会被重写
Codex 应用层会老老实实保存完整的会话记录和工具调用日志。但当上下文快满时,系统会触发 compaction,把旧内容”挤出去”——注意,不是简单粗暴地截断,而是先压缩、再续跑。
这就像搬家时打包行李:你不会把所有东西原封不动搬走,而是把冬天的衣服压缩袋抽真空、把零碎物品分类装箱——体积变小了,但该有的都还在。
2. 触发压缩时,执行一次”压缩轮次”
压缩轮次的目标不是复述聊天记录,而是产出一个工作态快照(你可以理解为:项目记忆 / 任务状态)。
这个快照包含什么?
任务目标、当前进度、关键决策与约束(我们要做什么?走到哪儿了?有什么硬性要求?)
已发现的问题、未解决的 TODO 列表、下一步计划(哪些坑踩过了?还有什么要做?接下来怎么走?)
重要文件路径 / 模块边界 / 接口约定(关键代码在哪?模块怎么切分的?接口怎么定义的?)
关键 tool 结果(测试失败原因、命令输出结论、PR 变更摘要等)
必要时保留少量关键代码片段(而不是整段历史对话)
OpenAI 对外的描述是:”pruning history while preserving the most important context”,修剪历史,但保留最重要的上下文。
3. 用”压缩结果 + 少量最新上下文”重启新窗口
压缩完成后,Codex 会把压缩产物塞进新 prompt(相当于系统给模型一份”到目前为止我们做了什么”的备忘录),再补上最近的交互和必要文件内容。
于是模型获得一个 fresh context window,继续干同一个任务。
这个过程会循环重复,直到任务完成。就像接力赛,每一棒都拿着上一棒压缩好的”状态包裹”,一路传递下去。
4. 为什么叫”原生”?
关键来了。
GPT-5.1-Codex-Max 被描述为首个原生训练来跨多个上下文窗口工作的模型。这意味着:
Compaction 不是外部随便写个 summary prompt 糊弄过去,而是把”如何压缩、仍能不断线地继续做正确的工程决策”当作一种能力进行训练/对齐。
换句话说,模型在训练时就学会了”怎么压缩上下文才不会把关键信息弄丢、怎么在新窗口里无缝衔接任务”。这不是后期拼凑的工程 trick,而是刻在模型 DNA 里的能力。
相关阅读:GPT-5.1-Codex-Max正式发布,超越Gemini 3,编程能力第一!(附使用方法)
Codex 这套压缩机制和 Claude Code 的 /compact 思路挺像,想拿两边放一起对比着用,国内调 Claude 不用绑海外卡,Code80 把真实 Claude 订阅帐号转成 API,和官方完全兼容,Claude Code 里换个 endpoint 就能跑。地址 code.ai80.vip
发布于 2025-11-25 17:39・广东
赞同 14​
3 条评论
16
喜欢
收起​

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册