sadtalker学习用于风格化音频驱动单图像说话人脸动画的真实 3D 运动系数的应用

论文出处

https://arxiv.org/abs/2211.12194

使用方法

  1. 打开项目的colab链接

https://colab.research.google.com/github/Winfredy/SadTalker/blob/main/quick_demo.ipynb#scrollTo=fAjwGmKKYl_I

在examples/source_image文件夹中添加希望动起来说话的图片,这里添加的是航天之父戚发轫,respect。

  1. 再用ttsmaker文字转语音工具,将戚先生在剧本中要说的话转为语音,链接如下

https://ttsmaker.com/zh-cn

  1. 生成wav文件后,上传到colab中的/examples/driven_audio文件夹,并在代码部分进行名称替换

  2. 接下来只需要按步骤运行demo,就能在result文件夹下生成想要的动起来的mp4文件了,我的视频大约1分半,用了约10分钟生成,生成效果如下(已经按第6步视频增强)。

4718_1711785136

5.生成的视频分辨率不够高,但相比之前自己使用的DID生成的数字人,真实度高了不少,DID生成的嘴巴明显是从另外找了一个,属于一眼假,DID链接如下D-ID | The #1 Choice for AI Generated Video Creation Platform

这次不用DID的另一个原因是生成的视频有水印了。

6.最后可以看到生成的视频较为模糊,用了一个手机上的app叫wink来视频增强

相关推荐
车载诊断技术14 分钟前
车载软件 --- 大一新生入门汽车零部件嵌入式开发
人工智能·架构·汽车·整车区域控制器·车载通信诊断
skywalk816331 分钟前
使用Ollama 在Ubuntu运行deepseek大模型:以DeepSeek-coder为例
linux·人工智能·ubuntu·deepseek
Stanford_110644 分钟前
物联网智能项目之——智能家居项目的实现!
物联网·学习·微信小程序·智能家居·微信公众平台·twitter·微信开放平台
纠结哥_Shrek1 小时前
Q学习 (Q-Learning):基于价值函数的强化学习算法
学习·算法
工程师焱记1 小时前
Vscode的AI插件 —— Cline
ide·人工智能·vscode
努力成为头发茂密的程序员2 小时前
(0基础版,无需输入代码爬取)新手小白初步学习八爪鱼采集器
数据库·学习·数据分析
因_果_律2 小时前
DeepSeek 云端部署,释放无限 AI 潜力!
人工智能·科技·ai·aigc·云服务·亚马逊云科技·deepseek
测试者家园2 小时前
AI在自动化测试中的伦理挑战
自动化测试·软件测试·人工智能·数据处理·数据脱敏·质量效能·伦理
Landy_Jay3 小时前
跟李沐学AI:视频生成类论文精读(Movie Gen、HunyuanVideo)
人工智能
花落已飘3 小时前
RK3568 opencv播放视频
人工智能·opencv·音视频