火山引擎计费实测:不提供缓存优惠,长上下文成本恐成开发者噩梦

经实测,火山引擎 Coding Plan 严格执行按 Token 计费,且 Kimi 2.6 与 GLM 5.1 等模型价格显著高于 Doubao。测试发现,该平台目前最大的痛点在于不支持“缓存优惠”,导致在处理长上下文时,每次交互都会全额扣除 Token,没有复用减免。这使得高频或长文本应用场景下的成本极其高昂,开发者在使用长上下文功能时需警惕额度消耗速度。

原文链接:V2EX 分享发现

抢沙发

评论前必须登录!

立即登录   注册