部分Google Gemini用户反映,模型在对话中存在过度调用图片生成工具(如Veo3/Imagen)的问题。用户在进行设计探讨或提示词咨询时,即便明确要求文字回复,系统仍会频繁触发Nanobanana等后台服务强制生成图片。这一现象不仅打断了用户的思考流程,也暴露了当前多模态AI在意图识别与工具调用机制上的生硬,反映出AI Agent在平衡服务主动性与用户控制权之间面临的挑战。
原文链接:Linux.do
部分Google Gemini用户反映,模型在对话中存在过度调用图片生成工具(如Veo3/Imagen)的问题。用户在进行设计探讨或提示词咨询时,即便明确要求文字回复,系统仍会频繁触发Nanobanana等后台服务强制生成图片。这一现象不仅打断了用户的思考流程,也暴露了当前多模态AI在意图识别与工具调用机制上的生硬,反映出AI Agent在平衡服务主动性与用户控制权之间面临的挑战。
原文链接:Linux.do
评论前必须登录!
立即登录 注册