社区实测:Gemma 4小参数模型数学能力惊艳,表现优于Gemini 2.5 Pro

在Linux.do社区的技术讨论中,有用户针对Google的新一代开源模型Gemma 4进行了简易数学能力测试。测试涉及26B和31B两个小参数版本,结果显示它们在连续五次针对高难度数学题的测试中均给出了正确答案。值得注意的是,据发帖者反馈,这组题目甚至连Google自家的闭源旗舰模型Gemini 2.5Pro都未能解答正确。这一发现引发了社区对Gemma 4在逻辑推理和数理领域能力的高度关注,也再次引发了业界关于“小参数模型是否能在特定领域通过优化超越大模型”的热议。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册