Kitten TTS v0.8 正式发布,推出了三款超轻量级文本转语音(TTS)模型,参数量在 15M 至 80M 之间。这些模型基于 ONNX 构建,专为边缘计算优化,最小版本体积仅 25MB,无需 GPU 即可在 CPU 上高效生成高质量 24kHz 音频。项目目前处于开发者预览阶段,提供 8 种内置音色、可调节语速及文本预处理功能,旨在解决移动端和嵌入式设备的语音合成需求。
原文链接:Hacker News
Kitten TTS v0.8 正式发布,推出了三款超轻量级文本转语音(TTS)模型,参数量在 15M 至 80M 之间。这些模型基于 ONNX 构建,专为边缘计算优化,最小版本体积仅 25MB,无需 GPU 即可在 CPU 上高效生成高质量 24kHz 音频。项目目前处于开发者预览阶段,提供 8 种内置音色、可调节语速及文本预处理功能,旨在解决移动端和嵌入式设备的语音合成需求。
原文链接:Hacker News
评论前必须登录!
立即登录 注册