开源项目 OpenTalking:一张图片复活角色,支持实时对话与音色复刻

OpenTalking 是一款基于 Soulx-flashtalk-14b 模型的开源项目,旨在打破“次元壁”实现高保真数字人交互。用户仅需上传一张图片,即可生成具备动态对话能力的虚拟角色,并集成了 LLM、STT 及 TTS 技术。该项目亮点在于支持实时语音交互、自定义角色预设以及极具趣味的音色复刻功能。为了降低部署门槛,开发团队优化了技术链路,用户只需本地部署一个 FlashTalk WebSocket 服务即可快速体验,为数字人应用提供了轻量化的落地解决方案。

原文链接:V2EX 分享发现

抢沙发

评论前必须登录!

立即登录   注册