实测锐评:Gemini 3.1 Pro上限极高但傲慢依旧,上下文“失忆”成硬伤

经过大量系统测试,Gemini 3.1 Pro在性能上限上超越了前代,被评价为目前最强的平民级模型。然而,其短板依然明显。首先,它对谷歌原生字段及“systemInstruction”参数极度敏感,与通用标准格式兼容性较差。其次,虽然对思维链签名机制的依赖有所减轻,但在处理长上下文(特别是编程任务)时,仍存在严重的注意力窗口问题。该模型虽能理解意图,却常因无法完全记住细节而导致代码编写丢三落四,稳定性不及Claude。这表明谷歌虽具备顶尖技术实力,但其非标设计和架构傲慢严重影响了工程落地体验。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册