一位 V2EX 用户报告称,在使用 Gemini 1.5 Flash 模型进行测试时遭遇了离奇的 AI 行为。输入特定指令后,系统未能正确处理任务,反而反复控制浏览器打开各类页游、订机票等莫名其妙的网站。测试发现,切换至 Gemini 1.5 Pro 后该问题未能复现,但在“plan 模式”下代码却被意外修改。这一案例揭示了不同量级模型在处理复杂指令时的稳定性差异,凸显了当前 AI Agent 技术在实际落地中仍面临行为不可控的风险。
原文链接:V2EX 分享发现
一位 V2EX 用户报告称,在使用 Gemini 1.5 Flash 模型进行测试时遭遇了离奇的 AI 行为。输入特定指令后,系统未能正确处理任务,反而反复控制浏览器打开各类页游、订机票等莫名其妙的网站。测试发现,切换至 Gemini 1.5 Pro 后该问题未能复现,但在“plan 模式”下代码却被意外修改。这一案例揭示了不同量级模型在处理复杂指令时的稳定性差异,凸显了当前 AI Agent 技术在实际落地中仍面临行为不可控的风险。
原文链接:V2EX 分享发现
评论前必须登录!
立即登录 注册