小米 MiMo-v2.5 系列 API 宣布永久降价高达 99%,加入 AI 推理价格战

Hacker News 上的一篇帖子引发了关于小米 MiMo-v2.5 系列 API 大幅降价的热议。标题中提到的 99% 降价主要针对缓存输入,这使得其定价策略与 DeepSeek 近期降低的成本保持一致。开发者反馈称,其账户分配的月度 Token 额度从约 7 亿激增至 380 亿,这比其过往使用总量至少高出 10 倍,显示出厂商激进的市场推广策略。评论区指出,这并非个例,而是继 DeepSeek 之后,中国 AI 公司的又一举措,与 Anthropic 和 Google 等美国公司近期提高 API 价格形成了鲜明对比。社区讨论认为,这种“零利润率”竞赛显然是一种战略行为,旨在通过极低的门槛抢占开发者生态。虽然有人质疑这些受限于芯片供应的公司如何在缺乏顶级 H100 或 Blackwell 硬件的情况下维持推理能力,但普遍共识是,对于绝大多数轻量级开发工作而言,这些低成本模型已经完全足够。随着中国大模型在性价比上的极速迭代,原本建立在高昂算力成本上的护城河正面临崩溃,全球 AI 开发者的选择正在发生实质性转移。

事件分析

此次降价标志着 AI 基础设施市场的严重两极分化。针对缓存输入 99% 的降价,凸显了一种技术转向:通过极致优化 KV Cache 缓存命中率来压缩推理成本,而非单纯依赖算堆叠。从产业影响看,市场正在分化为两个阵营:一方是 Anthropic、OpenAI 等致力于通过高溢价模型探索 AGI 边界;另一方是小米、DeepSeek 等以近乎免费的价格推动大规模落地。所谓的“AI 民主化”实际上演变为中美科技公司在定价策略上的直接博弈。这种价格战迫使行业重新评估模型的价值——当推理成本趋近于零时,竞争优势将从训练规模转向应用层的工程化能力、数据护城河以及端侧结合的效率。此外,对于受硬件限制的中国公司而言,在非英伟达顶级算力集群上实现如此低价的推理,也侧面暗示了国产算力集群调度优化或混合架构效率的显著提升。

💡 核心观点:大模型推理成本正迅速趋向于零,中美厂商的定价两极分化将彻底重塑应用层开发门槛与竞争格局。

原文链接:Hacker News

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册