Grok API 遭遇多模态瓶颈:图片生成导致后续对话中断

近日,有开发者在技术社区反馈了 xAI 旗下 Grok 模型 API 存在的一个技术性缺陷。在使用过程中,当 AI 在对话中生成了包含图片的信息后,若用户尝试继续追问或进行下一轮对话,系统会报错提示“仅支持txt格式”,从而导致交互流程被迫中断。这一现象揭示了 Grok 在多模态融合方面的不足,即在同一个对话上下文(Context)中,文本数据流与图像数据流的处理逻辑尚未完全打通。对于致力于构建复杂 AI 应用或 Agent 的开发者而言,这提示了当前大模型 API 在处理混合媒体交互时仍存在稳定性挑战。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册