MiniMax M3 正式发布:1M 超长上下文与原生多模态,瞄准 AI 编程与智能体高地

中国 AI 大模型厂商 MiniMax 今日正式发布旗下新一代基座模型 MiniMax M3。官方强调,该模型在编程和智能体等专业任务上已达到国际前沿水平。M3 采用了自主研发的全新注意力架构 MSA(MiniMax Sparse Attention),这一技术突破使其最高支持 100 万 token 的超长上下文窗口,显著优于绝大多数现有竞品,为处理海量代码库和长文档提供了基础。作为一个原生多模态模型,M3 不仅支持图片和视频的输入,更具备操作电脑桌面的能力,这标志着其在 Agent 应用层面的物理/虚拟交互能力取得了关键进展。在权威评测方面,M3 展现了极强竞争力:在软件工程基准 SWE-Bench Pro 上得分 59.0%,在终端执行基准 Terminal Bench 2.1 上高达 66.0%,在 SWE-fficiency 和 KernelBench Hard 上分别获得 34.8% 和 28.8% 的成绩。此外,针对智能体协议的 MCP Atlas 测试得分 74.2%,显示其在工具调用和任务规划方面的成熟度。尽管标题提及价格大幅上涨,但官方确认了 API 服务的正式上线,旨在服务专业开发者群体。

事件分析

MiniMax M3 的发布不仅是参数的升级,更是大模型从“文本生成”向“任务执行”演进的重要信号。其采用的 MSA 稀疏注意力架构解决了长上下文带来的算力与显存瓶颈,使得 1M token 的上下文在工程上变得可行,这对于 AI 编程和复杂数据分析场景至关重要。技术看点集中在“操作桌面”这一特性上,这表明国产模型正致力于突破纯对话的限制,向具备 UI 交互能力的 OS 级 Agent 发展,试图在 Anthropic 和 OpenAI 主导的 Computer Use 领域分一杯羹。在产业影响上,M3 直接对标 Claude 3.5 Sonnet 等编程强模型,通过 SWE-Bench 等高难度基准的高分,意在争夺 Cursor、GitHub Copilot 等 AI 开发工具背后的底层模型市场。后续走向将取决于其 API 性价比以及桌面操作能力的稳定性与安全性。

💡 核心观点:大模型竞争进入深水区,MiniMax M3 凭借超长上下文与桌面交互能力,硬刚国际顶尖模型在编程与 Agent 领域的护城河。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册