川普真会说中文?连嘴型都同步,用VideoReTalking一键生成你的AI播报员

你能想到这种画面吗?霉霉在节目中用普通话接受采访,特朗普在老家用中文脱口秀,蔡明老师操着一口流利的英文调侃潘长江老师..

这听起来似乎很魔幻,可如今全部由VideoReTalking实现了

你只需要传入一个视频文件和音频文件,它会生成一个新的视频,在这个视频里,不仅人物的嘴型会与音频同步,就连表情也会随着声音的起伏发生变化,而整个过程都在没有用户干预的情况下按顺序处理

工作流程

1、表情引导:给定一个会说话的头像视频,使用表情编辑网络根据相同的表情模板修改每一帧的表情,从而生成具有规范表情的视频

2、口型同步:将规范表情视频与给定的音频一起输入口型同步网络以生成口型同步视频

3、面部增强:通过身份感知面部增强网络和后期处理提高合成面部的照片真实感

VideoReTalking最新中文版下载

百度网盘:https://pan.baidu.com/s/1L_qScwf1Dmw52IBfLO_XmA?pwd=czgl

VideoReTalking使用起来非常简单,只需要3步

1、在下载资源的根目录找到examples\face文件夹,选择其中的视频文件

2、选择examples\audio文件夹下的音频文件

3、点击"开始"按钮

在控制台中,可以查看当前的处理进度,程序执行完毕会输出信息outfile: results/output.mp4

注意事项

①上传的视频中只能有一张人脸且每帧都要有人脸,人脸要求清晰可识别、不宜过大

②FaceDet进度到100%,控制台不接着打印信息是正常现象,需要等待一段时间

③视频处理速度和GPU有关,这里推荐gtx1060以上显卡,不支持A卡

相关推荐
NAGNIP6 小时前
一文搞懂深度学习中的通用逼近定理!
人工智能·算法·面试
冬奇Lab7 小时前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab7 小时前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
哥不是小萝莉8 小时前
OpenClaw 架构设计全解析
ai
AngelPP11 小时前
OpenClaw 架构深度解析:如何把 AI 助手搬到你的个人设备上
人工智能
宅小年11 小时前
Claude Code 换成了Kimi K2.5后,我再也回不去了
人工智能·ai编程·claude
九狼11 小时前
Flutter URL Scheme 跨平台跳转
人工智能·flutter·github
ZFSS11 小时前
Kimi Chat Completion API 申请及使用
前端·人工智能
warm3snow11 小时前
Claude Code 黑客马拉松:5 个获奖项目,没有一个是"纯码农"做的
ai·大模型·llm·agent·skill·mcp
天翼云开发者社区12 小时前
春节复工福利就位!天翼云息壤2500万Tokens免费送,全品类大模型一键畅玩!
人工智能·算力服务·息壤