智谱AI旗下的30B参数模型GLM-4.7-Flash现身Hugging Face。基准测试数据显示,该模型在多项任务中表现优异,特别是在SWE-bench Verified代码修复任务中得分59.2,大幅超越同量级的Qwen3-30B和GPT-OSS-20B。此外,其在AIME数学题和τ²-Bench智能体测试中也展现出强劲实力。这一开源发布为开发者和研究人员提供了除主流模型之外的又一高性能选择。
原文链接:Linux.do
智谱AI旗下的30B参数模型GLM-4.7-Flash现身Hugging Face。基准测试数据显示,该模型在多项任务中表现优异,特别是在SWE-bench Verified代码修复任务中得分59.2,大幅超越同量级的Qwen3-30B和GPT-OSS-20B。此外,其在AIME数学题和τ²-Bench智能体测试中也展现出强劲实力。这一开源发布为开发者和研究人员提供了除主流模型之外的又一高性能选择。
原文链接:Linux.do
评论前必须登录!
立即登录 注册