DeepSeek 现离奇漏洞:输入单一标签 `` 竟可触发随机回答与训练数据痕迹

近日,社区发现 DeepSeek 存在一个特殊的交互漏洞。用户仅需向模型发送 “ 标签,无需开启“深度思考”模式或输入其他指令,即可触发模型的“隐藏状态”。测试表明,该操作在“快速模式”下极易触发,模型会输出天马行空的随机话题,有时甚至直接展示其他用户的提问片段或疑似训练数据的内容。技术分析认为,这并非官方设计的“彩蛋”,而是分词器将特定标签识别为特殊 token 导致的逻辑错乱。这一发现不仅揭示了模型在处理特殊字符时的脆弱性,也引发了关于 AI 数据隔离与安全性的讨论。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册