Gemini 3.1 综合分霸榜第一,但代码能力仍被 Claude 按压?

近期,在 AI 模型分析网站 Artificial Analysis 的数据中,Google 的 Gemini 模型(文中称为 3.1 版本)表现惊人,综合评分极高并登顶榜首。然而,科技社区讨论指出,尽管其综合实力强劲,但在核心的代码生成能力上,该模型依然落后于 Claude Opus。这一反差引发了业界对于基准测试与实际应用落地的思考,也揭示了不同大模型在特定垂直领域的差异化优势。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册