川普真会说中文?连嘴型都同步,VideoReTalking AI数字人下载介绍

你能想到这种画面吗?霉霉在节目中用普通话接受采访,特朗普在老家用中文脱口秀,蔡明老师操着一口流利的英文调侃潘长江老师..

这听起来似乎很魔幻,可如今全部由VideoReTalking实现了

你只需要传入一个视频文件和音频文件,它会生成一个新的视频,在这个视频里,不仅人物的嘴型会与音频同步,就连表情也会随着声音的起伏发生变化,而整个过程都在没有用户干预的情况下按顺序处理

工作流程

1、表情引导:给定一个会说话的头像视频,使用表情编辑网络根据相同的表情模板修改每一帧的表情,从而生成具有规范表情的视频

2、口型同步:将规范表情视频与给定的音频一起输入口型同步网络以生成口型同步视频

3、面部增强:通过身份感知面部增强网络和后期处理提高合成面部的照片真实感

VideoReTalking最新中文版

百度网盘: https://pan.baidu.com/s/1AWJ6M69TFVZDcWYEdJn_dg?pwd=r3g8

VideoReTalking使用起来非常简单,只需要3步

1、在下载资源的根目录找到examples\face文件夹,选择其中的视频文件

2、选择examples\audio文件夹下的音频文件

3、点击"开始"按钮

在控制台中,可以查看当前的处理进度,程序执行完毕会输出信息outfile: results/output.mp4

注意事项

①上传的视频中只能有一张人脸且每帧都要有人脸,人脸要求清晰可识别、不宜过大

②FaceDet进度到100%,控制台不接着打印信息是正常现象,需要等待一段时间

③视频处理速度和GPU有关,这里推荐gtx1060以上显卡

相关推荐
AL.千灯学长23 分钟前
DeepSeek接入Siri(已升级支持苹果手表)完整版硅基流动DeepSeek-R1部署
人工智能·gpt·ios·ai·苹果vision pro
LCG元1 小时前
大模型驱动的围术期质控系统全面解析与应用探索
人工智能
lihuayong1 小时前
计算机视觉:主流数据集整理
人工智能·计算机视觉·mnist数据集·coco数据集·图像数据集·cifar-10数据集·imagenet数据集
政安晨1 小时前
政安晨【零基础玩转各类开源AI项目】DeepSeek 多模态大模型Janus-Pro-7B,本地部署!支持图像识别和图像生成
人工智能·大模型·多模态·deepseek·janus-pro-7b
一ge科研小菜鸡1 小时前
DeepSeek 与后端开发:AI 赋能云端架构与智能化服务
人工智能·云原生
冰 河1 小时前
‌最新版DeepSeek保姆级安装教程:本地部署+避坑指南
人工智能·程序员·openai·deepseek·冰河大模型
维维180-3121-14551 小时前
AI赋能生态学暨“ChatGPT+”多技术融合在生态系统服务中的实践技术应用与论文撰写
人工智能·chatgpt
豌豆花下猫2 小时前
Python 潮流周刊#90:uv 一周岁了,优缺点分析(摘要)
后端·python·ai
終不似少年遊*2 小时前
词向量与词嵌入
人工智能·深度学习·nlp·机器翻译·词嵌入
♡喜欢做梦2 小时前
Deepseek 与 ChatGPT:AI 浪潮中的双子星较量
ai·chatgpt·deepseek