Gemini灰度测试音乐生成新模型:中文发音改善,支持多语种与视频导出

据社区用户反馈,谷歌Gemini已悄然开启音乐生成模型的灰度测试。实测显示,新模型在歌词创作与旋律生成上表现出色,尤其解决了此前AI生成中文时的“台湾腔”发音问题,语音更加自然。目前该功能暂定生成30秒音频,但已支持中、英、日、俄、法等多语言,并新增了“含封面视频”的一键导出功能。随着未来API的开放,Gemini将在多模态生成领域对Suno等专业工具形成强有力的竞争。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册