HeyGem是一款基于生成式AI与深度学习推理服务的开源数字人视频创作平台,采用FastAPI+React前后端分离架构,支持通过Docker完整部署。平台集成了语音克隆、数字人驱动、文本生成口播视频等核心功能,包括Fish-Speech TTS文本转语音、Face2Face嘴型驱动、FunASR音频转文本等AI服务。用户可上传音频或视频创建个人声音模型和数字人形象,通过任务队列系统生成高质量数字人口播视频。该平台适用于教育行业自动生成课程视频、企业制作代言内容、内容创作虚拟主播视频以及AI研发测试等场景。项目提供完整部署方案,支持NVIDIA GPU加速,本地化存储保障数据安全。GitHub开源地址为kele-tao/HeyGemWeb,是搭建AI视频生成平台的理想解决方案。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册