通义千问团队近日发布了Qwen3-TTS模型,该模型支持音色创造和音色克隆两大核心功能。Qwen3-TTS-VD-Flash版本专注于声音设计,而Qwen3-TTS-VC-Flash版本则专注于声音克隆,为用户提供更丰富的语音合成选择。这一发布标志着通义千问在AI语音合成领域的重要进展,将为智能助手、有声读物、虚拟主播等多种应用场景提供更高质量的语音解决方案。该模型是通义千问AI产品线的重要组成部分,与通义千问聊天机器人、图像理解、图像生成、文档处理等功能形成互补,进一步完善了通义千问的多模态AI能力体系。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册