sadtalker学习用于风格化音频驱动单图像说话人脸动画的真实 3D 运动系数的应用

论文出处

https://arxiv.org/abs/2211.12194

使用方法

  1. 打开项目的colab链接

https://colab.research.google.com/github/Winfredy/SadTalker/blob/main/quick_demo.ipynb#scrollTo=fAjwGmKKYl_I

在examples/source_image文件夹中添加希望动起来说话的图片,这里添加的是航天之父戚发轫,respect。

  1. 再用ttsmaker文字转语音工具,将戚先生在剧本中要说的话转为语音,链接如下

https://ttsmaker.com/zh-cn

  1. 生成wav文件后,上传到colab中的/examples/driven_audio文件夹,并在代码部分进行名称替换

  2. 接下来只需要按步骤运行demo,就能在result文件夹下生成想要的动起来的mp4文件了,我的视频大约1分半,用了约10分钟生成,生成效果如下(已经按第6步视频增强)。

4718_1711785136

5.生成的视频分辨率不够高,但相比之前自己使用的DID生成的数字人,真实度高了不少,DID生成的嘴巴明显是从另外找了一个,属于一眼假,DID链接如下D-ID | The #1 Choice for AI Generated Video Creation Platform

这次不用DID的另一个原因是生成的视频有水印了。

6.最后可以看到生成的视频较为模糊,用了一个手机上的app叫wink来视频增强

相关推荐
快乐非自愿13 分钟前
AI重构低代码开发:从“可视化编码”到“自然语言编程”(技术解析+实战案例)
人工智能·低代码·重构
秋刀鱼 ..20 分钟前
第五届机电一体化、自动化与智能控制国际学术会议(MAIC 2025)
运维·人工智能·python·机器人·自动化·制造·新人首发
多则惑少则明25 分钟前
AI测试、大模型测试(五)AI测试工具有哪些
人工智能·测试工具·ai测试·大模型测试
沃丰科技26 分钟前
以全栈AI能力重塑智能客服服务效能
人工智能·机器学习·自然语言处理
O561 6O623O7 安徽正华露26 分钟前
(露)冷光源 大鼠洞板 新生鼠适配器
人工智能
musk121227 分钟前
深度学习中 z-score 标准化理解
人工智能·深度学习·z-socre
小脉传媒GEO优化29 分钟前
掌控数据燃料:面向ChatGPT的数据策略优化指南
人工智能·chatgpt
多则惑少则明29 分钟前
AI测试、大模型测试(四)AI测试分类&AI测试岗位分工
人工智能·ai测试·大模型测试·算法测试
喵了meme30 分钟前
Linux学习日记18:线程的分离
linux·运维·c语言·学习
Mxsoft61932 分钟前
我发现边缘节点资源不足致处理延迟,动态资源调度算法救场!
人工智能