写在前面
这两天再看 Codex,感觉它已经不是那个“帮你补几行代码”的工具了。
它更像一个会自己接活、自己拆任务、自己找路的工作台:你扔进去的不是一句提示词,而是一个目标;它接住以后,会继续拆分、执行、检查,甚至在你没盯着的时候把后续动作也顺手安排掉。
更有意思的是,OpenAI 这次给 Codex 的升级,不是单点增强,而是从模型、CLI、桌面端、权限体系一路往上重做。它要解决的也不只是“怎么写代码更快”,而是“怎么让 AI 真正进入你的工作流”。

这次变化,不是加了个功能,而是换了个方向
Codex 之所以会被说成正在经历“ChatGPT 时刻”,核心不是热闹,而是它开始从“编程助手”往“统一工作空间”演化。
最近这波变化里,最重要的信号有三个。
第一,模型层开始分工了。Codex 体系里已经出现了 GPT-5.5、GPT-5.4 / 5.4-mini、GPT-5.3-Codex 这一组搭配:
- GPT-5.5 被放在推荐默认位置,主打复杂编码、重构、调试、测试和知识类任务;
- GPT-5.4 更像主力型号,带来了 1M 长上下文、原生 computer use 和更强的工具搜索;
- GPT-5.4-mini 面向轻量子任务和子代理,适合做代码理解、大文件浏览、支线分析这类工作;
- GPT-5.3-Codex 则走极快响应路线,牺牲一点综合能力,换来更接近实时的编码反馈。
这套拆法很关键。大模型负责规划、判断、处理高难度修改,小模型负责扫描、切片、跑子任务,整个系统开始像一个真正的工程团队,而不是一个单线程聊天框。
第二,CLI 终于不只是“能用”,而是开始像一个成熟的 agent runtime。最近几版 CLI 的更新很密集,重点也很明确:
- 多代理协作 变得更显式了,线程上限、深度、等待时间、root / subagent 提示都摆到了台面上;
- 新增的
/goal持久化工作流,让长期目标可以被保存、暂停、恢复、清理,Codex 不再只处理一轮对话,而是能跟着项目跑很久; - 权限模型也重新整理成了 profile,把 TUI、会话、MCP 沙箱、API、Linux / Windows sandbox、网络代理等能力统一起来;
- 以前那个
--full-auto入口被明确弃用,说明官方已经不想让权限管理继续靠“默认全开”凑合了。
这背后其实是在补一个长期痛点:AI 编程真正进入日常工作后,最难的不是“会不会写”,而是“能不能稳定、可控、可追踪地写”。Codex 这次是在往这个方向补课。
第三,桌面端 App 的形态已经变了。它不再只是一个聊天窗口,而是在往“统一工作空间”靠拢:
- Chats 被拆成了 对话 和 项目;
- 可以先研究、写作、分析,等到要动文件时再把项目和目录引进来;
- 自动化 能按计划唤醒线程,定时检查、更新、续跑任务;
- thread 搜索、归档、worktrees、多窗口、菜单栏托盘这些功能,都是为了支持多项目并行;
- 插件市场、in-app browser、computer use、PR review、artifact viewer、Memories、SDK、GitHub Action、Slack / Linear 集成,也都在把 Codex 往更广的工作场景里推。

你会发现,它的边界已经不再是“代码生成”,而是“围绕代码和任务,把整台电脑都接进来”。
Codex 现在到底强在哪
如果只看一个点,很容易低估这次升级的意义。真正值得注意的是,它把几个原本分散的能力拼成了一条完整链路。
1. 从“回答问题”变成“拆解任务”
以前很多 AI 工具的体验是:你问它,它答你;你再追问,它再补一点。
Codex 这次更像是在做任务编排。你给它一个长期目标,它会先拆成子任务,再根据子任务去调用不同模型和工具。需要查代码库的时候,它去扫;需要做高难度修改的时候,它切到更强的模型;需要跑支线分析的时候,它交给更轻的子代理。
这种分层很像一个小型研发团队:资深工程师负责决策,初级工程师负责扫描和收集信息,自动化流水线负责跑重复动作。Codex 把这套东西做到了产品里。
2. 从“终端工具”变成“权限可控的执行体”
CLI 这次最值钱的地方,不是界面,而是权限。
很多人用 AI 编程工具最大的顾虑不是它能不能写,而是它会不会乱改、乱跑、乱连网。Codex 现在把权限收束到 profile 里,本质上是在告诉你:它不是一个随便放飞的脚本,而是一个有边界、能审计、能收回控制权的执行体。
这件事对生产环境很重要。因为真正的代码库不是玩具项目,里面有依赖、有环境变量、有私有接口、有发布流程。一个靠谱的 agent,必须先把“能做什么、不能做什么”说清楚。
3. 从“写代码”扩展到“看界面、动界面”
Codex App 这次最像“起飞”的地方,是它开始越过纯文本世界。
有了 in-app browser,它能在本地直接预览 UI、复现视觉 bug、验证修复;有了 computer use,它能去操作 macOS 原生应用,点按钮、改设置、跑模拟器流程,处理那些“只能人点、脚本很难碰”的界面动作。
这意味着什么?意味着 Codex 不只是知道代码怎么改,还能亲自去把改动验一遍。对开发者来说,这种闭环很重要:写完、跑通、看见结果,不需要你反复在多个工具之间切来切去。
4. 从“单个工具”变成“工作入口”
PR review、PDF / 表格 / 文档 / PPT 预览、偏好和项目约定迁移、Windows 原生 App、VS Code / Cursor / Windsurf 插件……这些东西单独看都不是惊天动地,但拼起来以后,Codex 就不再像一个孤立工具,而像一个工作入口。

你可以在这里开始一个任务,也可以在这里收尾一个任务;可以先分析,也可以直接执行;可以是文本工作,也可以是界面工作。它真正想做的,不是替代某个 IDE,而是成为你处理任务时最顺手的那层入口。

Codex 到底是什么?能干什么?
如果把外壳去掉,Codex 本质上就是一个面向代码和任务的 agent。
它不是那种“你打一行,它补一行”的补全器,而是可以独立完成较长流程的执行体。你可以让它:
- 读写文件;
- 执行命令;
- 跨文件重构;
- 做调试和测试;
- 跑长任务;
- 处理多代理协作;
- 在桌面端结合浏览器和原生应用一起干活。
官方订阅这边,现在也已经不是单一入口了。Codex 可以和 ChatGPT 的多个计划一起使用,包括 Plus、Pro、Business、Enterprise、Edu、Health、Gov、Teachers 等;OpenAI 的帮助中心也提到,Plus 是 20 美元/月,而 Pro 有 100 美元和 200 美元两档,更高档位能拿到更多 Codex 使用量。官方 rate card 还给了一个比较直接的判断:按使用方式不同,Codex 的平均成本大概会落在 每位开发者每月 100 到 200 美元 这个区间。
不过说实话,官方订阅对国内用户通常还是不太顺手——支付和网络都得多绕几步。要是你只是想少折腾一点,国内这边可以顺手看看 Code80,用起来会省很多中间环节。
常见问题
1. Codex 和 Claude Code 最大的区别是什么?
最直接的区别是工作流重心不同。Claude Code 更像终端里的高强度编程搭子,Codex 这次更像把“代码、任务、桌面、权限、自动化”揉成了一个工作空间。
2. Codex 适合什么场景?
适合长任务、跨文件重构、调试测试、多步骤执行、PR review、界面验证这类场景。越是需要上下文、权限和动作闭环的任务,Codex 的价值越明显。
3. CLI 和桌面端 App 怎么选?
喜欢命令行、追求可控性和脚本化,就选 CLI;更想把研究、执行、预览、PR、文件、桌面操作放在一起,就看桌面端 App。两者不是替代关系,更像是同一套能力的不同入口。
4. Codex 为什么这次看起来比以前更“主动”?
因为它不再只靠单个模型硬撑,而是把主模型、小模型、子代理、长期目标、自动化和权限体系串起来了。主动性不是凭空来的,是工作流设计把它推出来的。
5. 国内用户怎么更方便地用上?
如果你不想先被海外支付和网络环境卡住,可以直接看 Code80 这类国内渠道,少走一些弯路。









评论前必须登录!
立即登录 注册