xAI(埃隆·马斯克旗下的AI公司)发布了其最新的语音模型,显著提升了音频生成的流畅度与自然度。根据社区测试视频显示,新模型在处理高难度绕口令时表现依然流畅稳定,未见卡顿。此外,视频生成工具Grok Imagine也进行了重要升级,重点优化了语音质量,并实现了更精准的“唇形同步”技术,使得生成的虚拟人物说话口型与音频完美匹配。这标志着xAI在多模态AI领域的快速迭代,正在加速追赶行业领先水平。
原文链接:Linux.do
xAI(埃隆·马斯克旗下的AI公司)发布了其最新的语音模型,显著提升了音频生成的流畅度与自然度。根据社区测试视频显示,新模型在处理高难度绕口令时表现依然流畅稳定,未见卡顿。此外,视频生成工具Grok Imagine也进行了重要升级,重点优化了语音质量,并实现了更精准的“唇形同步”技术,使得生成的虚拟人物说话口型与音频完美匹配。这标志着xAI在多模态AI领域的快速迭代,正在加速追赶行业领先水平。
原文链接:Linux.do
评论前必须登录!
立即登录 注册