近日,国内大模型厂商 MiniMax 针对其 M3 系列模型调整了 API 定价策略,正式取消了此前备受争议的“缓存写入”费用。在此次调整之前,MiniMax 与阿里云曾是国内大模型市场中极少数针对 Prompt Caching(提示词缓存)的“写入”操作进行收费的厂商。这与 OpenAI、Claude 等国际主流厂商普遍仅对缓存命中后的“读取”操作收费的模式形成鲜明差异,导致国内开发者在长上下文应用中面临更高的隐性成本。据悉,MiniMax 早期可能试图模仿国际巨头的定价框架,但在模型实际能力未完全匹配定价的情况下,这种策略被指增加了开发者负担。此次 MiniMax M3 取消缓存写入费,降低了开发者在 Agent 及 RAG 场景下的试错门槛。虽然该单项费用被取消,但厂商在整体定价体系中仍通过其他维度维持了商业平衡,这一调整显示出国产大模型在定价策略上正加速向国际主流标准看齐。
事件分析
💡 核心观点:取消缓存写入费标志着国产大模型定价正从早期的激进“隐形收费”向符合开发者预期的国际主流标准回归,试图以更友好的生态换取规模优势。
原文链接:Linux.do

评论前必须登录!
立即登录 注册