近期有用户在 Linux.do 社区反馈,Google 最新发布的 Gemini 3.1 模型似乎无法有效隐藏其内部推理过程。相比于之前的 3.0 版本,Gemini 3.1 更频繁地出现“思维链(CoT)泄露”情况,直接将原本应隐藏的系统指令和推理步骤展示给用户。这一现象表明,尽管 Google 试图加强对模型内部逻辑的封装,但在特定交互下,模型的“思维防御机制”依然脆弱。这不仅为安全研究提供了样本,也让外界得以一窥大模型的底层运作逻辑。
原文链接:Linux.do
近期有用户在 Linux.do 社区反馈,Google 最新发布的 Gemini 3.1 模型似乎无法有效隐藏其内部推理过程。相比于之前的 3.0 版本,Gemini 3.1 更频繁地出现“思维链(CoT)泄露”情况,直接将原本应隐藏的系统指令和推理步骤展示给用户。这一现象表明,尽管 Google 试图加强对模型内部逻辑的封装,但在特定交互下,模型的“思维防御机制”依然脆弱。这不仅为安全研究提供了样本,也让外界得以一窥大模型的底层运作逻辑。
原文链接:Linux.do
评论前必须登录!
立即登录 注册