阿里正式推出 Qwen3.6-Max-Preview 模型,相较于 Qwen3.6-Plus,新模型在智能体编程、世界知识及指令遵循方面取得显著突破。数据显示,其在 SkillsBench 和 SciCode 等编程基准测试中分别提升 9.9% 和 6.3%,同时在 SuperGPQA 和 QwenChineseBench 等知识评估中表现更强。目前该模型已在 Qwen Studio 开放使用,显示出阿里在强化模型垂直领域落地能力上的急迫与野心。
原文链接:Linux.do
阿里正式推出 Qwen3.6-Max-Preview 模型,相较于 Qwen3.6-Plus,新模型在智能体编程、世界知识及指令遵循方面取得显著突破。数据显示,其在 SkillsBench 和 SciCode 等编程基准测试中分别提升 9.9% 和 6.3%,同时在 SuperGPQA 和 QwenChineseBench 等知识评估中表现更强。目前该模型已在 Qwen Studio 开放使用,显示出阿里在强化模型垂直领域落地能力上的急迫与野心。
原文链接:Linux.do
评论前必须登录!
立即登录 注册