许多用户反映使用 Claude API 中转站时,虽然单价便宜 70%,但余额消耗速度却比官方更快。本文深入剖析了造成这一“低价高耗”现象的技术根源。关键在于官方的 Prompt Caching(提示词缓存)功能,它能将长对话中重复上下文的成本降低 90%。然而,中转站因逆向接口限制或账号池轮询策略,往往无法有效利用缓存,导致每次请求都重复计费。此外,隐藏的系统提示词和频繁切换服务商导致的缓存重置,进一步推高了隐性成本。文章结论指出,对于长对话或重度使用者,拥有高缓存命中率的官方渠道,长期总成本实际上远低于看似便宜的中转站。
原文链接:V2EX 分享发现

IT资源栈
评论前必须登录!
立即登录 注册