有开发者实测发现,Gemini 3.1 Pro 在处理约 20 万字符的长文翻译任务时表现不佳,出现严重的幻觉和 Token 重复现象。尽管宣称支持 1M 上下文,但其在仅完成约五分之一任务时便开始“胡言乱语”,推测有效上下文可能仅在 200k 左右。相比之下,DeepSeek 的 1M 版本在长文本能力上表现更佳,引发了对大模型“有效上下文”与宣传参数之间差距的广泛讨论。
原文链接:Linux.do
有开发者实测发现,Gemini 3.1 Pro 在处理约 20 万字符的长文翻译任务时表现不佳,出现严重的幻觉和 Token 重复现象。尽管宣称支持 1M 上下文,但其在仅完成约五分之一任务时便开始“胡言乱语”,推测有效上下文可能仅在 200k 左右。相比之下,DeepSeek 的 1M 版本在长文本能力上表现更佳,引发了对大模型“有效上下文”与宣传参数之间差距的广泛讨论。
原文链接:Linux.do
评论前必须登录!
立即登录 注册