近日,小米 MIMO 平台推出了新的 Token Plan 套餐,宣传语称实现了“加量不加价”,Credits 用量提升至 5-8 倍,并对已用额度进行了全量重置。然而,这一表面上的“福利”在实际使用中引发了开发者的质疑。用户发现,尽管新版 Pro 套餐的 Credits 额度从旧版的 700M 激增至 38B,但实际 Token 消耗速度异常快。经过详细的计费规则对比分析发现,问题的核心在于新旧版兑换 Token 的汇率发生了巨大变化。旧版 Pro 调用 V2.5-Pro 模型时消耗倍率为 2x,约可使用 350M Tokens。而在新版规则下,不同类型的 Token 扣费标准差异极大:缓存输入仅扣除 2.5 Credits/token,但未缓存输入高达 300 Credits/token,输出更是高达 600 Credits/token。若按照常见的 1:1 输入输出比例(未缓存)计算,平均每 Token 需消耗 450 Credits。这意味着 38B 的巨额 Credits 实际仅能兑换约 84.4M Tokens。与旧版相比,在缓存命中率不高的场景下,新版套餐的实际可用 Token 数量不仅没有随 Credits 涨幅同步增加,反而缩水了约 76%。此外,针对 Claude Code 等开发工具,由于 Prompt 拼接机制导致难以命中缓存,实际开发体验可能远不如旧版套餐。
事件分析
💡 核心观点:通过虚增 Credits 面值并拉大非缓存计费倍率,实则是将模型成本压力转嫁给开发者,高额度并非高性价比。
原文链接:Linux.do

评论前必须登录!
立即登录 注册