本文探讨了在配置 CPA 工具反代 Codex 模型时出现的“降智”故障。经技术排查,该问题并非模型本身缺陷,而是由 API 端点选择与 reasoning 参数格式不匹配导致。文章指出,`/chat/completions` 端点应配置 `“reasoning_effort”: “high”`,而 `/responses` 端点则需使用 `“reasoning”: {“effort”: “high”}`。这一发现为开发者排查反代服务中的模型性能衰减提供了重要的技术参考。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册