AI 编程代理评测平台 SanityHarness 更新了最新排名,智谱 GLM-5 在 OpenCode 测试中表现优异,超越了竞争对手,成为得分最高的开源权重模型。同时,MiniMax M2.5 也在排名中引发关注。SanityHarness 榜单专注于提供高信号量、与具体实现无关的评估,通过加权分数和通过率对比模型性能。GLM-5 的这一成绩不仅展示了其在复杂代码任务中的强劲竞争力,也标志着国产大模型在自主编程与智能体领域的技术实力正在快速逼近国际前沿水平。
原文链接:Linux.do
AI 编程代理评测平台 SanityHarness 更新了最新排名,智谱 GLM-5 在 OpenCode 测试中表现优异,超越了竞争对手,成为得分最高的开源权重模型。同时,MiniMax M2.5 也在排名中引发关注。SanityHarness 榜单专注于提供高信号量、与具体实现无关的评估,通过加权分数和通过率对比模型性能。GLM-5 的这一成绩不仅展示了其在复杂代码任务中的强劲竞争力,也标志着国产大模型在自主编程与智能体领域的技术实力正在快速逼近国际前沿水平。
原文链接:Linux.do
评论前必须登录!
立即登录 注册