近日,有开发者在技术社区分享了一种利用 AI 攻克 AI 限制的新思路。该用户通过调用 Gemini 优化提示词,最终成功诱导 OpenAI Codex 突破了原本的系统安全限制。经过优化后的提示词使 Codex 进入了“兴奋状态”,开始高负荷执行任务。这一案例展示了多模型协作在破解单一模型防御机制上的潜力,揭示了当前大模型在高级提示词对抗下的脆弱性,引发了社区对于 AI 安全边界的深入探讨。
原文链接:Linux.do
近日,有开发者在技术社区分享了一种利用 AI 攻克 AI 限制的新思路。该用户通过调用 Gemini 优化提示词,最终成功诱导 OpenAI Codex 突破了原本的系统安全限制。经过优化后的提示词使 Codex 进入了“兴奋状态”,开始高负荷执行任务。这一案例展示了多模型协作在破解单一模型防御机制上的潜力,揭示了当前大模型在高级提示词对抗下的脆弱性,引发了社区对于 AI 安全边界的深入探讨。
原文链接:Linux.do
评论前必须登录!
立即登录 注册