开源TTS新秀Kitten TTS发布:最小模型仅25MB,纯CPU即可运行

Kitten TTS v0.8 正式发布,推出了三款超轻量级文本转语音(TTS)模型,参数量在 15M 至 80M 之间。这些模型基于 ONNX 构建,专为边缘计算优化,最小版本体积仅 25MB,无需 GPU 即可在 CPU 上高效生成高质量 24kHz 音频。项目目前处于开发者预览阶段,提供 8 种内置音色、可调节语速及文本预处理功能,旨在解决移动端和嵌入式设备的语音合成需求。

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册