近日,有开发者基于开源项目 kiro.rs 发布了优化版本,针对 Anthropic Claude API 的 Prompt Cache(提示词缓存)机制进行了深度适配。原版代理在处理缓存时,无法正确返回 cache_read_input_tokens,导致 Claude Code 等客户端误判缓存未命中,引发计费虚高。该 Fork 版本通过引入本地状态追踪器,利用 SHA-256 指纹计算请求前缀,严格对齐 Anthropic 的 TTL 和计费门槛,解决了 Billing Header 漂移等难题。这使得客户端能准确获取缓存数据,显著降低长对话场景的体感成本,并优化了凭据轮换逻辑。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册