中国 AI 大模型厂商 MiniMax 今日正式发布旗下新一代基座模型 MiniMax M3。官方强调,该模型在编程和智能体等专业任务上已达到国际前沿水平。M3 采用了自主研发的全新注意力架构 MSA(MiniMax Sparse Attention),这一技术突破使其最高支持 100 万 token 的超长上下文窗口,显著优于绝大多数现有竞品,为处理海量代码库和长文档提供了基础。作为一个原生多模态模型,M3 不仅支持图片和视频的输入,更具备操作电脑桌面的能力,这标志着其在 Agent 应用层面的物理/虚拟交互能力取得了关键进展。在权威评测方面,M3 展现了极强竞争力:在软件工程基准 SWE-Bench Pro 上得分 59.0%,在终端执行基准 Terminal Bench 2.1 上高达 66.0%,在 SWE-fficiency 和 KernelBench Hard 上分别获得 34.8% 和 28.8% 的成绩。此外,针对智能体协议的 MCP Atlas 测试得分 74.2%,显示其在工具调用和任务规划方面的成熟度。尽管标题提及价格大幅上涨,但官方确认了 API 服务的正式上线,旨在服务专业开发者群体。
事件分析
💡 核心观点:大模型竞争进入深水区,MiniMax M3 凭借超长上下文与桌面交互能力,硬刚国际顶尖模型在编程与 Agent 领域的护城河。
原文链接:Linux.do

评论前必须登录!
立即登录 注册