Minimax 升级引争议:开发者实测代码能力倒退,Agent 逻辑循环成本激增

近日,开发者社区 Linux.do 上出现针对大模型厂商 Minimax 的强烈吐槽。一名开发者发帖实测指出,Minimax 最新发布的 3.0 版本在核心能力上出现了严重的“负向更新”,尤其是在代码审计和数据分析场景下表现糟糕。该开发者表示,在未修改任何项目代码和 Agent 逻辑的情况下,新版本的稳定性大幅下降,导致任务执行陷入死循环。具体数据显示,原本仅需 30 次左右的工具调用轮次,现在飙升至 100 次以上,甚至因超过最大重试次数而直接导致任务失败。此外,基础数学能力也出现明显退化,如出现 9.11 减 9.9 算出 0.27 的低级错误。在成本方面,用户发现 API 配额消耗速度异常加快,原本稳定的 1500 次/5小时配额,现在仅执行半次分析就消耗了 20% 的额度,暗示厂商可能存在“暗改”定价或模型变相涨价的情况。对比测试显示,Minimax 3.0 的综合表现甚至不如 DeepSeek V4 等竞品,该开发者因此决定停止续费并迁移服务商。这一事件再次引发了技术圈对于大模型版本迭代稳定性和 Agent 落地成本的担忧。

事件分析

针对此类技术反馈,核心看点在于大模型版本迭代中的非确定性风险对 AI Agent 落地的影响。Agent 应用高度依赖模型在逻辑推理和工具调用上的稳定性,模型输出的微小“漂移”都会导致 Agent 链路出现循环错误,直接造成开发者的 Token 成本激增。Minimax 3.0 被指出的轮次爆炸问题,反映出厂商在优化模型通用能力时,可能破坏了原有的指令遵循能力。与此同时,DeepSeek 等竞品在编码和推理领域的表现逐渐获得开发者的信任,显示出在当前“模型价格战”背景下,用户对于性价比和稳定性的敏感度极高。模型厂商若无法保障生产环境的稳定性,将面临开发者迅速“用脚投票”转向开源模型或其他商用 API 的风险。

💡 核心观点:AI Agent 开发极度依赖模型的推理一致性,基础模型的“负向更新”会导致高昂的试错成本,正加速开发者向 DeepSeek 等高性价比且稳定的竞品迁移。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册