GLM-4.7作为智谱AI最新发布的AI模型,在编程能力方面实现了显著突破。相比前代GLM-4.6,该模型在多语言智能编程和终端任务中表现突出,SWE-bench基准测试得分提升5.8%达到73.8%,SWE-bench多语言测试提升12.9%达到66.7%,Terminal Bench 2.0测试提升16.5%达到41%。在UI设计方面,GLM-4.7能生成更现代、整洁的网页和更精确布局的幻灯片。工具使用能力也有显著提升,在τ^2-Bench基准测试和网络浏览BrowseComp中表现优异。此外,该模型在数学和推理能力方面提升12.4%,HLE基准测试得分达到42.8。GLM-4.7还在聊天、创意写作和角色扮演等场景中表现出色,并在17项基准测试中超越了GPT-5、Claude Sonnet 4.5、Gemini 3.0 Pro等多款主流AI模型。
原文链接:Hacker News

IT资源栈
评论前必须登录!
立即登录 注册