IT资源栈-IT资源与技术分享IT资源栈-IT资源与技术分享IT资源栈
  • 首页
  • AI
  • 前沿
  • 专题
  • 碎片
  • 架构
  • 实战
  • 安全
  • 生活
  • 工具
  • 管理
  • 监控
  • 读者墙
  • 标签云
  • 文章存档
  • 友情链接
Hi, 请登录     我要注册     找回密码

阿里开源Qwen3-TTS:97ms低延迟,支持自然语言“设计”人声

分类:前沿 阅读(1) 评论(0)

阿里巴巴通义千问团队正式发布新一代开源语音合成模型Qwen3-TTS,涵盖0.6B至1.8B参数规模。该模型支持10种主流语言,不仅能实现3秒音频高保真克隆,更创新支持通过自然语言指令“设计”人声。技术上采用12Hz高压缩率Tokenizer及双轨混合流式架构,端到端合成延迟仅97毫秒,极大提升了人机对话的自然感。

原文链接:Linux.do

开源模型语音合成通义千问

相关阅读

  • Trinity Large 登场:400B 稀疏 MoE 模型,宣称超越 Llama 4
  • AI2发布SERA开源编码代理,仅需400美元即可适配私有代码库
  • 英伟达Earth-2模型开源,加速AI天气预报普及
  • Qwen3-Max-Thinking正式发布:引入自适应扩展技术,性能对标顶尖模型
  • 全球首个太空算力网披露:国星宇航2800颗卫星实现天数天算
  • 斯坦福英伟达联手发布TTT-Discover,AI实现临场自我进化
  • 登顶AI榜单!智谱GLM-4.7-Flash获评百亿参数下最强开源模型
  • 通义千问Qwen3-TTS发布:97ms超低延迟,语音克隆仅需3秒
  • 阿里云Qwen团队开源Qwen3-TTS语音生成模型
  • 突破Claude供应链瓶颈,CodePlan实现多模型API兼容,开源用量激增

抢沙发

评论前必须登录!

立即登录   注册

© 2026   IT资源栈