如何看待智谱 GLM 5 以「Pony Alpha」匿名代号在 OpenRouter 上先行亮相?

AI工具导航站
同名“AI工具导航站”,跟上时代的脚步
5 人赞同了该回答
这波“无间道”玩得太有技术含量了!
就在过去的一周里,整个硅谷和AI圈都在疯狂寻找一个代号为「Pony Alpha」的神秘模型。
有人猜它是OpenAI憋的GPT-5.5,也有人说是Claude 4.5的秘密马甲。
结果一觉醒来,靴子落地,谜底揭晓:这个骗过了硅谷精英、霸榜外网的“扫地僧”,竟然是GLM-5!
就在刚刚,智谱AI不仅正式认领了身份,还反手把GLM-5直接开源了。
据官方介绍,GLM-5的参数量达到了惊人的744B(7440亿),但激活参数仅为40B。
更重要的是,它在Coding(编程)和Agent(智能体)的能力上,直接冲到了开源模型的全球SOTA(最强)水平。
数据不会撒谎。在Artificial Analysis的最新权威榜单中,GLM-5综合得分位居全球第四,开源第一!
那效果到底如何?是骡子是马,咱们拉出来溜溜。给大家看几个实测案例就清楚了。
不是写代码,而是“写工程”
GLM-5这次主打的是「Agentic Engineering」(智能体工程)。
先来看个文生应用的效果。
我们给GLM-5提了个极其刁钻的物理模拟需求:创建一个卫星系统,模拟卫星绕地球运行,并向地面发送信号,要符合多普勒效应。
你看这个信号的波纹扩散,它不仅仅是理解了“画图”,而是理解了背后的物理规律。
再加大难度。有网友让它做一个“交通流模拟图”。
有网友 @anurudhsharmaa 用它一行提示词生成了一个全新的网站。
不光会写代码,还能帮你“搞钱”
如果说写代码太抽象,那我们看点直接的——赚钱能力。
在业内有一个非常有意思的评测叫Vending Bench 2,它要求AI在一年内经营一个模拟的自动售货机业务。这考的可不仅仅是算术,而是长期的资源规划和商业头脑。
结果如何?GLM-5在测试结束时,账户余额达到了4432美元!
这个成绩直接拿下了开源模型的第一名,不仅把Gemini 3 Pro甩在身后,更是紧咬着Claude Opus 4.5。
GLM-5凭什么这么强?翻看技术报告,我发现了几个很有意思的细节。
首先,它采用了MoE(混合专家)架构。虽然总参数高达744B,但每次思考时只激活40B。
其次,智谱这次非常听劝,首次集成了DeepSeek Sparse Attention(稀疏注意力机制)。
经常关注AI圈的朋友对这个词肯定不陌生,这是DeepSeek的核心技术之一。
引入这个机制后,GLM-5在处理几十万行长代码时,不仅不会迷失,推理成本还大幅下降。
GLM-5还构建了一个全新的“Slime”训练框架,让模型不再是死记硬背,而是在长期的交互中通过“实习”来学习。
特斯拉前AI总监Andrej Karpathy曾预言:我们即将进入「智能体工程」时代。
随着GLM-5的开源,传统的“码农”时代可能真的要倒计时了。
在未来,你不需要逐行砌砖写代码,你只需要定义系统、定义审美、定义什么是“好玩”,AI自然就能帮你完成!
目前GLM-5已经全量上线,还没体验的朋友,可以去试试!
顺带一提,想横向对比 GLM-5 和 Claude Opus 的编程表现,国内用户可以通过 Code80 直接调 Claude API,真实订阅帐号转出来的,跟官方 API 兼容,换个 endpoint 就能跑,不用折腾海外支付。地址 code.ai80.vip
其他阅读:
国内如何安全搞定ChatGPT Plus购买? 附四种实测方法,100%成功!
4 赞同 · 3 评论 文章
告别封号!2025最新Claude注册及Pro付费教程,100%成功
21 赞同 · 0 评论 文章
发布于 2026-02-12 19:56・广东
赞同 5​
2
喜欢
收起​

AD · 推广 前往 code80.ai › code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。

抢沙发

评论前必须登录!

立即登录   注册