针对小米AI推出的Token Plan,社区分析揭示了其独特的计费逻辑。不同于业界通常将KV Cache(缓存)视为低成本资源的做法,小米该方案将缓存Token与输入输出Token同等计费(1:1消耗额度)。虽然乍看之下有违常识,但经测算,由于Token Plan折算后的基础单价极低,其整体费用依然低于标准API的“读缓存”价格。分析指出,该方案适合低缓存命中率的全新对话场景,但在灵活性上不如竞品的一次性流量包,对于重度依赖缓存复用的开发者而言性价比存疑。
原文链接:Linux.do
针对小米AI推出的Token Plan,社区分析揭示了其独特的计费逻辑。不同于业界通常将KV Cache(缓存)视为低成本资源的做法,小米该方案将缓存Token与输入输出Token同等计费(1:1消耗额度)。虽然乍看之下有违常识,但经测算,由于Token Plan折算后的基础单价极低,其整体费用依然低于标准API的“读缓存”价格。分析指出,该方案适合低缓存命中率的全新对话场景,但在灵活性上不如竞品的一次性流量包,对于重度依赖缓存复用的开发者而言性价比存疑。
原文链接:Linux.do
评论前必须登录!
立即登录 注册