技术栈
语音驱动图像
知来者逆
9 个月前
人工智能
·
数字人
·
sadtalker
·
语音驱动图像
·
虚拟主播
数字人解决方案— SadTalker语音驱动图像生成视频原理与源码部署
随着数字人物概念的兴起和生成技术的不断发展,将照片中的人物与音频输入进行同步变得越来越容易。然而,目前仍存在一些问题,比如头部运动不自然、面部表情扭曲以及图片和视频中人物面部的差异等。为了解决这些问题,来自西安交通大学等机构的研究人员提出了 SadTalker 模型。