谷歌推出Gemini 3.1 Flash Live:专为实时语音与视觉AI Agent打造

谷歌AI负责人Logan Kilpatrick正式发布了代号为“Gemini 3.1 Flash Live”的新模型。这是一款专为构建具备实时语音和视觉能力的AI Agent而打造的底层技术。据官方透露,团队在过去一年多时间里,专注于模型架构、底层基础设施及用户体验的深度打磨。这一努力带来了显著的成果,特别是在响应质量、系统可靠性以及交互延迟方面实现了“阶跃式”的突破。该模型的推出标志着谷歌在实时多模态交互领域迈出了关键一步,为开发更自然的语音助手和视觉智能体提供了强力支持。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册