报告:mimo-v2.5-pro 思考模式下复杂推理问题输出空白的 Bug

近日,有开发者在技术社区报告了小米系大模型“mimo-v2.5-pro”在开启思考模式时存在的一个严重 Bug。使用 Anthropic Python SDK 调用该模型时,若将参数 `thinking` 设为 `enabled` 并提问简单的问候或基础计算题,模型能正常输出思考过程与最终答案。然而,当面对如“糖果口味与形状组合概率”等复杂逻辑推理问题时,虽然模型内部生成了长达 6000 至 12000 字符的详细思考链,但最终返回的文本块长度却为 0,导致答案完全丢失。测试表明,该故障与思考过程的长度强相关,推测原因可能是思考过程消耗了过多预算,导致最终输出生成被截断或 API 处理逻辑存在缺陷。

事件分析

此类 Bug 暴露了当前长思维链模型在工程实现上的潜在短板。随着模型在复杂推理任务中投入的计算成本增加,其对输出 Token 的控制机制面临严峻挑战。对于采用类 Anthropic 接口规范的衍生模型而言,如何在 `thinking` 块与 `text` 块之间进行合理的资源分配与缓冲区管理至关重要。如果思考过程耗尽了分配的上下文窗口或触发了未公开的内部限制,会导致高价值内容在最终生成环节丢失。这也提醒开发者在使用兼容接口时,需警惕不同厂商在实现细节上的差异,特别是关于思维预算的限制参数目前往往缺乏明确文档。

💡 核心观点:长思考链不仅是智力比拼,更是工程落地的试金石,资源分配机制需持续优化。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册