MOSI.AI 与 OpenMOSS 团队发布了全新的 MOSS-TTS 开源家族模型,包含五大核心模型,覆盖从高保真语音克隆、长文本朗读、多说话人对话到实时流式交互及音效生成的全场景能力。该系列模型采用模块化管线设计,支持从 1.7B 到 8B 的多种规格。其对话模型 MOSS-TTSD v1.0 在竞技场主观评测中表现优异,击败了 Gemini 2.5-pro 和豆包等顶尖闭源模型。目前,所有模型权重已在 GitHub 和 Hugging Face 全面开源,为构建低成本、高性能的语音智能体提供了强有力的开源底座。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册