阿里发布Qwen3.6-Max-Preview:智能体编程能力暴涨,大模型竞速进入新阶段

阿里正式推出 Qwen3.6-Max-Preview 模型,相较于 Qwen3.6-Plus,新模型在智能体编程、世界知识及指令遵循方面取得显著突破。数据显示,其在 SkillsBench 和 SciCode 等编程基准测试中分别提升 9.9% 和 6.3%,同时在 SuperGPQA 和 QwenChineseBench 等知识评估中表现更强。目前该模型已在 Qwen Studio 开放使用,显示出阿里在强化模型垂直领域落地能力上的急迫与野心。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册