Wav2Lip视频人脸口型同步(Win10)

最近比较火的一个AI场景,就是用原声讲外语,嘴型同步,网上找了些资料,今天也跑起来了,推荐 Wav2Lip,官网地址:Github Wav2Lip

环境准备

  • Python3.6
  • ffmpeg
  • git clone https://github.com/Rudrabha/Wav2Lip.git
  • pip install -r requirements.txt
  • 下载人脸检测模型,并放在路径 face_detection/detection/sfd/s3fd.pth
  • Wav2Lip模型下载,放到路径 face_detection/detection/sfd/wav2lip.pth

上述步骤中涉及到下载地址的,直接访问官网首页对应链接即可下载

安装异常排查

opencv 安装异常

requirements.txt 中的 opencv-contrib-python>=4.2.0.34 修改为 opencv-contrib-python==4.2.0.34

pytorch 1.1.0 安装异常

直接进 pytorch 官网,用官网的方法安装 https://pytorch.org/get-started/previous-versions/#v110

视频demo

直接用官方的视频demo,进入 https://bhaasha.iiit.ac.in/lipsync/ 这个地址,里面的三个视频可以直接下载使用

音频生成

推荐这个网站,很好用 https://www.text-to-speech.cn/

运行命令

python inference.py --checkpoint_path ./face_detection/detection/sfd/wav2lip.pth --face D:/Ekoz/Items/QiuBao/dictator_orig.mp4 --audio D:/Ekoz/Items/QiuBao/output.wav

最终合成的视频,在 results 目录下

相关推荐
OpenApi.cc4 小时前
2026年最新openapi:免费图片人脸识别和视频人脸识别工具
音视频
FlightYe9 小时前
HDR详解
linux·音视频·显示器·视频编解码·hdr
做萤石二次开发的哈哈9 小时前
ERTC-产品介绍-产品功能
音视频·实时音视频
searchforAI11 小时前
2026年音视频笔记工具横评:通义听悟、讯飞听见、Get笔记、Ai好记
人工智能·笔记·gpt·aigc·音视频·语音识别·知识图谱
jiayong2311 小时前
AI精准控制图片视频生成完全指南
人工智能·计算机视觉·音视频
云水一下11 小时前
HTML5 从入门到精通:有声有色——音频、视频与嵌入内容,让网页告别沉默
前端·音视频·html5
学如逆水,不进则退11 小时前
浏览器端视频转音频技术实现:Web Audio API 实战
前端·音视频
weixin_4083180411 小时前
医疗直播ROI怎么算?3年30场项目数据总结的一套量化评估模型(附计算表格)
音视频
ZFSS12 小时前
Pixverse 视频生成 API 集成指南
人工智能·mysql·ai·ai作画·音视频·ai编程·ai写作
EasyDSS12 小时前
私有化音视频系统/视频高清直播点播EasyDSS技术优化解锁大型活动直播新体验
大数据·音视频