小米发布了MiMo-V2-Flash-0204模型更新,重点强化了Thinking模式的性能表现。在编程领域,该模型在SWE-Bench Verified上评分提升至78.6%,代码生成质量显著提高。针对Agent场景,模型解决了工具调用的稳定性问题,准确率从64%跃升至97%,大幅增强了执行可靠性。此外,通过优化思维链生成策略,模型在保持高性能的同时,使平均生成长度缩减13%至30%,有效降低了推理成本。
原文链接:Linux.do
小米发布了MiMo-V2-Flash-0204模型更新,重点强化了Thinking模式的性能表现。在编程领域,该模型在SWE-Bench Verified上评分提升至78.6%,代码生成质量显著提高。针对Agent场景,模型解决了工具调用的稳定性问题,准确率从64%跃升至97%,大幅增强了执行可靠性。此外,通过优化思维链生成策略,模型在保持高性能的同时,使平均生成长度缩减13%至30%,有效降低了推理成本。
原文链接:Linux.do
评论前必须登录!
立即登录 注册