MiniMax 调整 M3 计费策略:取消缓存写入费,对标国际主流模型定价

近日,国内大模型厂商 MiniMax 针对其 M3 系列模型调整了 API 定价策略,正式取消了此前备受争议的“缓存写入”费用。在此次调整之前,MiniMax 与阿里云曾是国内大模型市场中极少数针对 Prompt Caching(提示词缓存)的“写入”操作进行收费的厂商。这与 OpenAI、Claude 等国际主流厂商普遍仅对缓存命中后的“读取”操作收费的模式形成鲜明差异,导致国内开发者在长上下文应用中面临更高的隐性成本。据悉,MiniMax 早期可能试图模仿国际巨头的定价框架,但在模型实际能力未完全匹配定价的情况下,这种策略被指增加了开发者负担。此次 MiniMax M3 取消缓存写入费,降低了开发者在 Agent 及 RAG 场景下的试错门槛。虽然该单项费用被取消,但厂商在整体定价体系中仍通过其他维度维持了商业平衡,这一调整显示出国产大模型在定价策略上正加速向国际主流标准看齐。

事件分析

从技术架构与商业逻辑来看,Prompt Caching(缓存机制)是降低长文本推理成本的关键技术,区分“写入”与“读取”计费是行业惯例。此前 MiniMax 对写入收费,意味着开发者在系统初始化阶段(即使未发生实际推理 Token 消耗)就需付费,这直接扼杀了部分高频交互场景的可行性。此次取消写入费,不仅是单纯的价格下调,更是对开发者“启动成本”的优化。这反映出国产大模型厂商的竞争焦点已从简单的“每 Token 价格战”,转向对特定场景(如长上下文、Agent 记忆)计费模型的精细打磨。通过消除不合理的“隐形门槛”,厂商试图构建更符合开发者预期的计费体系,以提升 API 的市场留存率。

💡 核心观点:取消缓存写入费标志着国产大模型定价正从早期的激进“隐形收费”向符合开发者预期的国际主流标准回归,试图以更友好的生态换取规模优势。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册