碾压GPT-5与DeepSeek?Gemini 3.1 Pro 成功攻克顶级竞赛数学难题

近日,一道涉及红蓝卡片数值变换的高难度竞赛数学题引发了AI圈的激烈比拼。测试结果显示,Google的Gemini 3.1 Pro模型表现惊人,成功解出该题并求得$ n=99 $的正确答案,成为目前唯一答对的AI。相比之下,Grok 4 Agents解答失败,GPT-5.2 Thinking因思维链过长而崩溃,DeepSeek V3.2 Speciale思考过久未果,Kimi也未能攻克。这一结果不仅验证了Gemini在复杂逻辑推理和长链思考上的强悍实力,也为当前顶尖大模型的数学能力提供了新的参考坐标。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册