一名开发者在 GitHub 上报告,Anthropic 旗下的 Claude Code CLI 在 Pro Max 5x (Opus) 套餐下出现严重的配额消耗异常。尽管仅进行了轻度使用,其额度在 1.5 小时内即告耗尽,而此前重度工作持续了 5 小时。经用户技术排查发现,问题根源在于系统可能将“缓存读取”的 Token 按全价计入速率限制,而非预期的 1/10 折扣价。鉴于 Opus 模型拥有 100 万 Token 的上下文窗口,这种计费逻辑使得每次请求都消耗大量配额。此外,后台闲置会话的自动操作也被指加剧了这一问题。
原文链接:Hacker News

IT资源栈
评论前必须登录!
立即登录 注册