小米 MIMO 新计费解析:Credits 额度暴涨背后,实际可用 Token 或缩水 75%

近日,小米 MIMO 平台推出了新的 Token Plan 套餐,宣传语称实现了“加量不加价”,Credits 用量提升至 5-8 倍,并对已用额度进行了全量重置。然而,这一表面上的“福利”在实际使用中引发了开发者的质疑。用户发现,尽管新版 Pro 套餐的 Credits 额度从旧版的 700M 激增至 38B,但实际 Token 消耗速度异常快。经过详细的计费规则对比分析发现,问题的核心在于新旧版兑换 Token 的汇率发生了巨大变化。旧版 Pro 调用 V2.5-Pro 模型时消耗倍率为 2x,约可使用 350M Tokens。而在新版规则下,不同类型的 Token 扣费标准差异极大:缓存输入仅扣除 2.5 Credits/token,但未缓存输入高达 300 Credits/token,输出更是高达 600 Credits/token。若按照常见的 1:1 输入输出比例(未缓存)计算,平均每 Token 需消耗 450 Credits。这意味着 38B 的巨额 Credits 实际仅能兑换约 84.4M Tokens。与旧版相比,在缓存命中率不高的场景下,新版套餐的实际可用 Token 数量不仅没有随 Credits 涨幅同步增加,反而缩水了约 76%。此外,针对 Claude Code 等开发工具,由于 Prompt 拼接机制导致难以命中缓存,实际开发体验可能远不如旧版套餐。

事件分析

此次小米 MIMO 计费调整反映了 AI API 聚合平台在模型成本上涨压力下的定价策略转型。通过引入“Credits”这一中间货币单位,并大幅调整针对不同缓存状态的 Token 兑换汇率,平台实际上是在引导用户优化使用习惯以降低其自身的后端推理成本。从技术层面看,新版计费极度依赖缓存命中,高达 120 倍的缓存与非缓存输入价差,迫使开发者必须尽可能复用上下文。然而,对于 Claude Code 等高频、动态交互的开发场景,前置 Prompt 和动态生成的特性决定了其天然难以命中缓存,这导致开发者极易陷入“高额度、低耐用”的陷阱。这种“数字通胀”式的营销手法,虽然提升了账面数字的吸引力,但也增加了开发者评估实际成本的计算复杂度,提醒业界在选择 API 供应商时需透过面值看本质,关注具体的单Token成本而非虚标的积分数量。

💡 核心观点:通过虚增 Credits 面值并拉大非缓存计费倍率,实则是将模型成本压力转嫁给开发者,高额度并非高性价比。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册