Wav2Lip实践

1. 安装

1.1 安装 conda以指定python版本运行环境

下载:Index of /https://repo.anaconda.com/archive/index.html

1.2 如按旧项目基于python3.6版本对话,会有很多包找不到的情况,经摸索后以python3.9构建成功,

复制代码
conda install --channel defaults conda python=3.9 --yes
conda update --channel defaults --all --yes

conda update -n base -c defaults conda
conda create -n py3.9 python=3.9


conda activate py3.9
conda deactivate

conda env list

#添加阿里源
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple
pip config set install.trusted-host mirrors.aliyun.com

requirements.txt 内容

复制代码
#librosa==0.7.0
librosa
#numpy==1.17.1
numpy==1.24
opencv-contrib-python>=4.2.0.34
#opencv-python==4.1.0.25
opencv-python
#torch==1.1.0
torch
#torchvision==0.3.0
torchvision
tqdm==4.45.0
#numba==0.48
numba

(py3.9) D:\Projects\Wav2Lip>pip install -r requirements.txt 

2. CPU与GPU驱动模式

装好后,程序没检查到可用的cuda的话,会使用CPU模式跑,直接拉满100%使用率,一条20秒的片子合成约需20mins 。

手上有块NVDIA GeForce RTX 3060,需分别安装 CUDA, cuDNN 及对应python库的支持,参考CUDA安装教程_SU_ZCS的博客-CSDN博客,一条20秒的片子合成约需6mins,提升一倍多。

命令example:

复制代码
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a1.mp4 --audio src/audio/a1.wav --outfile results/a1.mp4
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a2.mp4 --audio src/audio/a2.wav --outfile results/a2.mp4
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a3.mp4 --audio src/audio/a3.wav --outfile results/a3.mp4
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a4.mp4 --audio src/audio/a4.wav --outfile results/a4.mp4
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a5.mp4 --audio src/audio/a5.wav --outfile results/a5.mp4
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a6.mp4 --audio src/audio/a6.wav --outfile results/a6.mp4
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a8.mp4 --audio src/audio/a8.wav --outfile results/a8.mp4
相关推荐
GPUStack1 小时前
NVIDIA H200/H20 DeepSeek-V4-Pro 部署指南、压测性能与稳定性调优建议
ai·性能调优·模型推理·gpustack·deepseek-v4
兢谨网安1 小时前
Trae + Skill 知识库文档
ai
陈童学哦1 小时前
深度解析星云SDK破开数字人实时交互
ai·开发·具身驱动
阿Y加油吧1 小时前
小林大模型|Agent 核心原理与面试答题模板
ai
rannn_1111 小时前
【FastAPI|快速入门】第一个FastAPI程序、路由、参数、相应类型、自定义响应数据格式、异常响应处理
python·ai·fastapi·web·开发
程序员老邢1 小时前
【重启日记】第五周复盘:持续突破高位,把 “平台期” 变成 “上升期”
java·运维·经验分享·ai·devops
老唐7772 小时前
30分钟手搓 Agent:LLM + Tools + Loop + Memory 跑通最小闭环
人工智能·ai·语言模型·agent·llama·智能体
Mr. zhihao2 小时前
深入理解 ReAct 循环:从 LLM 决策到工具执行的完整闭环
python·ai·react
zz0723202 小时前
大模型开发框架 —— SpringAI
ai·springai
张忠琳2 小时前
【vllm】(八)vLLM v1 Simple KV Offload — 系统级架构深度分析之二
ai·架构·vllm