川普真会说中文?连嘴型都同步,用VideoReTalking一键生成你的AI播报员

你能想到这种画面吗?霉霉在节目中用普通话接受采访,特朗普在老家用中文脱口秀,蔡明老师操着一口流利的英文调侃潘长江老师..

这听起来似乎很魔幻,可如今全部由VideoReTalking实现了

你只需要传入一个视频文件和音频文件,它会生成一个新的视频,在这个视频里,不仅人物的嘴型会与音频同步,就连表情也会随着声音的起伏发生变化,而整个过程都在没有用户干预的情况下按顺序处理

工作流程

1、表情引导:给定一个会说话的头像视频,使用表情编辑网络根据相同的表情模板修改每一帧的表情,从而生成具有规范表情的视频

2、口型同步:将规范表情视频与给定的音频一起输入口型同步网络以生成口型同步视频

3、面部增强:通过身份感知面部增强网络和后期处理提高合成面部的照片真实感

VideoReTalking最新中文版下载

百度网盘:https://pan.baidu.com/s/1L_qScwf1Dmw52IBfLO_XmA?pwd=czgl

VideoReTalking使用起来非常简单,只需要3步

1、在下载资源的根目录找到examples\face文件夹,选择其中的视频文件

2、选择examples\audio文件夹下的音频文件

3、点击"开始"按钮

在控制台中,可以查看当前的处理进度,程序执行完毕会输出信息outfile: results/output.mp4

注意事项

①上传的视频中只能有一张人脸且每帧都要有人脸,人脸要求清晰可识别、不宜过大

②FaceDet进度到100%,控制台不接着打印信息是正常现象,需要等待一段时间

③视频处理速度和GPU有关,这里推荐gtx1060以上显卡,不支持A卡

相关推荐
有Li28 分钟前
稀疏视角CBCT重建的几何感知衰减学习|文献速递-基于深度学习的病灶分割与数据超分辨率
人工智能·深度学习·学习
知来者逆31 分钟前
探索大规模语言模型(LLM)在心理健康护理领域中的应用与潜力
人工智能·gpt·深度学习·神经网络·自然语言处理·chatgpt·llm
weixin_4432906931 分钟前
【阅读记录-章节2】Build a Large Language Model (From Scratch)
人工智能·语言模型·自然语言处理
cts61835 分钟前
NLP开发常见问题
人工智能·机器学习·自然语言处理
三月七(爱看动漫的程序员)36 分钟前
LM2 : A Simple Society of Language Models Solves Complex Reasoning
人工智能·gpt·语言模型·自然语言处理·chatgpt·langchain·1024程序员节
程序小旭1 小时前
大模型基础BERT——Transformers的双向编码器表示
深度学习·自然语言处理·bert
学不会lostfound1 小时前
三、计算机视觉_01图像的基本操作
人工智能·opencv·计算机视觉·pil·卷积池化
小黄人软件2 小时前
【AI协作】让所有用电脑的场景都能在ChatGPT里完成。Canvas :新一代可视化交互,让AI易用易得
人工智能·chatgpt·canvas
知来者逆2 小时前
基于集成Whisper 与 Pepper-GPT改进人机交互体验并实现顺畅通信
人工智能·gpt·语言模型·自然语言处理·whisper·人机交互
摆烂仙君2 小时前
《Probing the 3D Awareness of Visual Foundation Models》论文解析——单图像表面重建
人工智能·深度学习·计算机视觉