AI工具导航站
同名“AI工具导航站”,跟上时代的脚步
2 人赞同了该回答
一句话总结:强,实在是太强了!
下面我从测评榜单到实际使用两方面,介绍一下新版的Gemini 2.5 Pro。
就在刚刚,Gemini 2.5 Pro又迎来了升级,现在的版本是Gemini 2.5 Pro(0605),来看看它到底有哪些升级吧。
除此之外,Gemini 2.5 Pro(06-05)还引入了「思考预算」,最高达32k,还改进了函数调用等功能。
Gemini 2.5 Pro到底有多强?
其中个人认为最猛的,那必然是代码能力了。 编程能力在 Aider Polyglot 中,超过了 Claude Opus 4。
而且推理能力也得到了十足的长进,在GPQA 及「人类终极考验」等顶级测试中取得第一,但是在其他领域中不足其他的模型,但也是在第一梯队。
更厉害的还是它的实战表现。
它还能通过Three.js创建出3D DNA模型,效果非常逼真,这是我在其他模型中没有看到的。
数据科学家Diego对新版的Gemini 2.5 Pro、GPT-4.5、Claude Sonnet 3.7和Grok 3做了一个简单的编程测试。
让它们编写一段代码实现交通信号灯的工作原理,我们来看看哪个模型表现得更好。
Gemini 2.5 Pro(0605)
GPT-4.5
Claude Sonnet 3.7
Grok 3
这效果大家一眼就可以看出来了吧,Gemini 2.5 Pro遥遥领先,Claude 3.7的模型也不行。
最近Gemini的人数更是暴增,周使用人数目前是排在全球的第三位,前面两个分别是ChatGPT和Canvas。
ChatGPT估计看着慌了,开始推出一美金开通ChatGPT Team会员的套餐。
前提你是新用户,或者没有开通过会员的,重要的是,可以一次开通5个席位,换句话说,你可以邀请5个人一起使用ChatGPT Plus会员。
如果你还没有薅,可以看我之前的文章。
相关阅读:
如何花费一美金开通ChatGPT Team会员
mp.weixin.qq.com/s/br-kDLNnQMKjHCeMMfXsZg
文里好几处拿 Gemini 和 Claude Opus 4、Sonnet 3.7 对比,想自己跑一遍对照的话,国内调 Claude 这侧不用绑海外卡,用 Code80 直接接 Claude API 就行,真实订阅帐号转 API,和官方完全兼容,换个 endpoint 即可。地址 code.ai80.vip。
发布于 2025-06-06 20:18・广东
赞同 2
收藏
喜欢
收起

IT资源栈
评论前必须登录!
立即登录 注册