一句话指令让 Codex “智商回升”:实测降智概率从 80% 降至 20%

针对 OpenAI Codex 在编程任务中频繁出现的“降智”现象(即模型输出重复、无效内容或无法完成指令),开发者社区 Linux.do 发现了一种极具成本效益的缓解方案。该方案通过在项目的 `AGENTS.md` 文件中添加一句简单的指令:“DO NOT send optional commentary”,成功将 Codex 任务失败的测试概率从 80% 显著降低至 20%。该发现基于社区用户对 Codex 系统行为的深入调查,指出过量的可选注释干扰了模型的推理路径。相较于直接修改底层系统 prompt 的复杂操作,修改项目配置文件更为便捷且易于推广。测试结果显示,该配置虽然会导致 Codex 不再输出中间思考步骤,但并不影响其最终执行代码任务的能力。该验证脚本已开源,为受困于模型不稳定的 AI 编程工具用户提供了一种可行的临时修复手段,揭示了提示词工程中“降噪”对于提升模型稳定性的重要性。

事件分析

这一发现揭示了当前大模型在 Agent 模式下运行时的一个核心缺陷:容易陷入无意义的中间状态循环。Codex 等模型在生成过多解释性文本时,往往会分散计算资源,导致对核心任务的注意力下降,即所谓的“降智”。通过“禁言”中间过程,强制模型专注于结果输出,实际上是一种通过减少 token 消耗路径来提高任务完成率的“提纯”手段。这表明,现阶段 AI 编程工具的稳定性不仅取决于模型能力,更高度依赖于精细的提示词约束。未来,AI Agent 的架构设计可能需要重新审视“思维链”与“执行链”的分离机制,以避免模型在自我解释中迷失方向。

💡 核心观点:屏蔽冗余的思考过程展示,强制模型专注任务执行,是当前解决 Agent 推理发散最有效的工程手段。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册