谷歌Gemini 3.1 Pro性能飞跃:全知幻觉率暴降55%,霸榜AA基准测试

根据Artificial Analysis发布的最新全知指数排行榜,谷歌Gemini模型在处理“幻觉”问题上取得了突破性进展。新版本Gemini 3.1 Pro在维持知识准确率不变的前提下,将全知幻觉率从前代3.0 Pro的88%大幅降至33%,降幅高达55%。这一显著改进直接推动其全知指数提升了17个点,帮助谷歌稳固了在该基准测试中的霸主地位,显示出其在提升大模型真实性与可靠性方面的技术实力。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册