GitHub 开源项目 OpenTalking 近日迎来重要更新,正式推出视频“克隆”模式。作为一种实时数字人解决方案,OpenTalking 此次升级允许用户利用视频素材直接驱动数字人形象,突破了传统仅靠音频驱动的限制。该功能的核心技术点在于能够精准捕捉并复刻源视频中的面部表情与头部动作,同时新增了面部动作幅度的调节参数。这意味着用户既可以追求高度拟真的表情还原,也可以通过参数调整创造出夸张、风格化甚至抽象化的视觉表现,极大地拓展了该工具在创意领域的玩法。项目团队强调保持免费和开源,致力于为开发者提供可自主部署的数字人技术,从而避免使用昂贵且数据隐私不可控的商业 SaaS 服务。目前项目代码已在 GitHub 平台公开,并附带了详细的 Bilibili 视频演示,展示了从静止模型到动态表情生成的全流程,适用于虚拟直播、实时交互等多种 AIGC 应用场景。
事件分析
💡 核心观点:视频克隆能力的加入填补了开源数字人在高保真交互上的短板,有助于打破商业SaaS方案在虚拟代理领域的垄断。
原文链接:V2EX 分享发现

评论前必须登录!
立即登录 注册