Wav2Lip实践

1. 安装

1.1 安装 conda以指定python版本运行环境

下载:Index of /https://repo.anaconda.com/archive/index.html

1.2 如按旧项目基于python3.6版本对话,会有很多包找不到的情况,经摸索后以python3.9构建成功,

conda install --channel defaults conda python=3.9 --yes
conda update --channel defaults --all --yes

conda update -n base -c defaults conda
conda create -n py3.9 python=3.9


conda activate py3.9
conda deactivate

conda env list

#添加阿里源
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple
pip config set install.trusted-host mirrors.aliyun.com

requirements.txt 内容

#librosa==0.7.0
librosa
#numpy==1.17.1
numpy==1.24
opencv-contrib-python>=4.2.0.34
#opencv-python==4.1.0.25
opencv-python
#torch==1.1.0
torch
#torchvision==0.3.0
torchvision
tqdm==4.45.0
#numba==0.48
numba

(py3.9) D:\Projects\Wav2Lip>pip install -r requirements.txt 

2. CPU与GPU驱动模式

装好后,程序没检查到可用的cuda的话,会使用CPU模式跑,直接拉满100%使用率,一条20秒的片子合成约需20mins 。

手上有块NVDIA GeForce RTX 3060,需分别安装 CUDA, cuDNN 及对应python库的支持,参考CUDA安装教程_SU_ZCS的博客-CSDN博客,一条20秒的片子合成约需6mins,提升一倍多。

命令example:

python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a1.mp4 --audio src/audio/a1.wav --outfile results/a1.mp4
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a2.mp4 --audio src/audio/a2.wav --outfile results/a2.mp4
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a3.mp4 --audio src/audio/a3.wav --outfile results/a3.mp4
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a4.mp4 --audio src/audio/a4.wav --outfile results/a4.mp4
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a5.mp4 --audio src/audio/a5.wav --outfile results/a5.mp4
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a6.mp4 --audio src/audio/a6.wav --outfile results/a6.mp4
python inference.py --checkpoint_path wav2lip_gan.pth --face src/video/a8.mp4 --audio src/audio/a8.wav --outfile results/a8.mp4
相关推荐
AlfredZhao10 小时前
公众号已上线 Ask AI 功能
ai·智能体·公众号·deepseek·ask ai
CodeCaster10 小时前
他来了,为大模型量身定制的响应式编程范式(1) —— 从接入 DeepSeek 开始吧
java·ai·langchain
哥不是小萝莉11 小时前
使用 DeepSeek R1 和 Ollama 开发 RAG 系统
ai·deepseek
gange57414 小时前
AI将会取代生活的方方面面吗?
人工智能·ai·ai作画·生活·ai编程·ai写作·百度云
Sator114 小时前
C#与AI的交互(以DeepSeek为例)
ai·语言模型·c#
FIT2CLOUD飞致云15 小时前
MaxKB上架至阿里云轻量应用服务器镜像市场
ai·开源·大模型·知识库·maxkb·问答
chaplinthink17 小时前
LangChain大模型框架& Dify低代码 AI 开发平台
ai·langchain·dify
做一个有理想的码农21 小时前
win11本地部署deepseek大模型(安装ollama+docker+open-webui)最终实现自己的项目可通过API调用投喂数据后的模型
docker·ai·api·ollama·deepseek
恶猫1 天前
[特殊字符]清华大学:DeepSeek从入门到精通.pdf(清华领航,驾驭DeepSeek,开启AI新境界)
ai·pdf·deepseek
不叫猫先生2 天前
云电脑接入DeepSeek?探讨ToDesk云电脑、海马云、顺网云的AI潜能
人工智能·ai·云电脑·deepseek