Wav2Lip视频人脸口型同步(Win10)

最近比较火的一个AI场景,就是用原声讲外语,嘴型同步,网上找了些资料,今天也跑起来了,推荐 Wav2Lip,官网地址:Github Wav2Lip

环境准备

  • Python3.6
  • ffmpeg
  • git clone https://github.com/Rudrabha/Wav2Lip.git
  • pip install -r requirements.txt
  • 下载人脸检测模型,并放在路径 face_detection/detection/sfd/s3fd.pth
  • Wav2Lip模型下载,放到路径 face_detection/detection/sfd/wav2lip.pth

上述步骤中涉及到下载地址的,直接访问官网首页对应链接即可下载

安装异常排查

opencv 安装异常

requirements.txt 中的 opencv-contrib-python>=4.2.0.34 修改为 opencv-contrib-python==4.2.0.34

pytorch 1.1.0 安装异常

直接进 pytorch 官网,用官网的方法安装 https://pytorch.org/get-started/previous-versions/#v110

视频demo

直接用官方的视频demo,进入 https://bhaasha.iiit.ac.in/lipsync/ 这个地址,里面的三个视频可以直接下载使用

音频生成

推荐这个网站,很好用 https://www.text-to-speech.cn/

运行命令

python inference.py --checkpoint_path ./face_detection/detection/sfd/wav2lip.pth --face D:/Ekoz/Items/QiuBao/dictator_orig.mp4 --audio D:/Ekoz/Items/QiuBao/output.wav

最终合成的视频,在 results 目录下

相关推荐
中议视控3 小时前
RTSP和RTSM编码推送软件让中控系统控制实现可视化播控
网络·分布式·物联网·5g·音视频
愚公搬代码8 小时前
【愚公系列】《剪映+DeepSeek+即梦:短视频制作》025-字幕:用文字来美化画面(添加字幕)
音视频
EasyCVR9 小时前
安防监控/视频存储/云存储平台EasyCVR全场景智能视频监控解决方案深度解析
音视频
呆萌小新@渊洁10 小时前
音频识别入门内容
macos·音视频·xcode
云边散步11 小时前
godot2D游戏教程系列二(20)
笔记·学习·音视频
唯创知音11 小时前
低BOM、高集成:WT2605A8-24SS蓝牙音频芯片在电动牙刷中的应用方案
音视频·wt2605a·蓝牙音频芯片·电动牙刷方案
线束线缆组件品替网11 小时前
Amphenol RJE1Y36610644401 CAT6A网线组件选型与替代指南
网络·人工智能·数码相机·电脑·音视频·硬件工程·游戏机
不想看见40414 小时前
Qt+FFmpeg 极简播放器示例【音视频方向简单讲解】
qt·ffmpeg·音视频
纠结哥_Shrek15 小时前
AI视频生成提示词工程完全指南
人工智能·音视频
Alonse_沃虎电子15 小时前
沃虎电子:音频变压器5大痛点剖析与厂家定制化解决方案
网络·音视频·信息与通信·产品·介绍·电子元器件