最近Claude Code的更新引发了开发者的成本焦虑。由于该工具在第一条系统消息中注入了动态变化的`cch`参数,导致经由NewAPI转换至其他厂商的请求无法命中缓存。这使得原本可以缓存的十几万token上下文失效,实际利用率极低,API账单随之暴涨。经过技术排查,作者发现这是客户端直出内容的机制问题。通过在NewAPI中配置正则表达式,将这一动态值强制固定,即可完美恢复缓存功能。这一发现不仅解决了燃眉之急,也为多模型共存的生态部署提供了重要参考。
原文链接:Linux.do
最近Claude Code的更新引发了开发者的成本焦虑。由于该工具在第一条系统消息中注入了动态变化的`cch`参数,导致经由NewAPI转换至其他厂商的请求无法命中缓存。这使得原本可以缓存的十几万token上下文失效,实际利用率极低,API账单随之暴涨。经过技术排查,作者发现这是客户端直出内容的机制问题。通过在NewAPI中配置正则表达式,将这一动态值强制固定,即可完美恢复缓存功能。这一发现不仅解决了燃眉之急,也为多模型共存的生态部署提供了重要参考。
原文链接:Linux.do
评论前必须登录!
立即登录 注册