OpenAI 升级 Codex:解锁 Windows 计算机控制能力,支持跨设备远程操控

OpenAI 针对开发者工具 Codex App 进行了重要版本更新,正式在 Windows 平台解锁了“计算机使用”能力。该功能使 AI Agent 不再局限于代码生成,而是能通过屏幕视觉分析、模拟鼠标点击与键盘输入,直接与 Windows 桌面应用程序进行物理层面的交互。这标志着 Codex 已具备从编写代码到在本地环境中执行、运行及调试的全流程自动化能力。此外,系统推出了跨设备远程控制功能以适应多平台开发场景。开发者现在可以在 Mac 电脑或移动设备的 ChatGPT 界面中,直接向联网的 Windows 设备发送任务指令,并跨端实时监控 Agent 的执行进度。在成本管理方面,全新的 Profile 面板集成了 Token 消耗的实时审计图表与自限机制,允许开发者设定用量上限,从而在利用 Agent 进行高频开发时避免意外的高额费用。此次更新体现了 OpenAI 在强化 AI 实际操作能力与跨平台协作体验上的最新进展。

事件分析

此次更新的核心在于将 AI 的交互模式从“文本生成”推向了“物理交互”。Windows 桌面控制能力的解锁,意味着 Codex 能够像人类开发者一样操作 IDE、终端和浏览器,解决了 AI 编程工具中常见的“代码生成但无法验证运行”的断层问题。跨设备远控功能则进一步模糊了本地与云端的界限,提升了多设备协同的开发效率。Token 审计机制的引入,也侧面反映了自动化 Agent 在实际部署中面临的成本控制挑战。从行业角度看,OpenAI 正在快速整合计算机控制能力,试图在 AI 编程助手领域建立更深的护城河,未来此类 Agent 将逐渐从辅助工具向独立执行单元进化。

💡 核心观点:OpenAI 补齐了 Codex 在 Windows 端的自动化短板,标志着 AI Agent 从代码生成向真实物理环境执行的关键跨越。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册