近期,有开发者在部署AI接口聚合工具CPA时发现,当调用Codex模型进行代码编写任务,系统仅能输出单句响应随即中断,无法实现预期的连续流式传输。技术排查显示,该问题源于API协议的代际断层:CPA目前支持的是旧版`chat.completions`协议,而Codex模型则强制要求基于`responses`协议进行交互。尝试通过降级配置强制兼容会导致服务直接启动报错。这一故障不仅是个案,更折射出当前AI开源生态中,上游模型协议快速迭代与下游中转工具更新滞后之间的尖锐矛盾,迫使开发者必须在功能完整性与系统稳定性之间做出艰难选择。
原文链接:Linux.do

评论前必须登录!
立即登录 注册