基于Roop视频换脸

Roop 是一个强大的一键换脸工具,允许用户在视频中替换面部,只需要目标面部的一张图片,无需数据集,无需训练。

相对于之前的 Simswap 来说效果要好很多,不过需要注意的是没有授权不要商用。

文章目录

环境搭建

创建虚拟环境。

shell 复制代码
conda create -n myenv python=3.10.6

项目克隆。

shell 复制代码
git clone https://github.com/s0md3v/roop.git

激活虚拟环境并安装依赖,补充安装显卡依赖。

shell 复制代码
pip install -r requirements.txt
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

进入项目后执行命令启动。

shell 复制代码
python run.py

此时会自动下载各种模型,对于模型不能下载的问题请看最后错误解答部分。

使用方法

基础功能

启动命令之后会看到下面的操作界面

这里分别解释一下他们的作用

  • select face 选择要替换的人脸照片
  • select targen 选择要被替换的视频
  • Keey target fps 和被替换的视频保持一致的帧率
  • Keep temporary frames 是否保留替换过程中的图片
  • Skip target audio 是否跳过音频(一般不使用)
  • Many faces 是否有多张脸(一般不使用)

点击 Preview 预览按钮会弹出预览界面,默认抓取视频中出现的第一个人物的脸部进行替换。

也可以移动视频预览的进度条到想替换的人脸片段,使用方向键 或者 进行替换。这个是之前锁定的华仔,现在换成了梁仔。

选择好要替换的人物直接点开始就可以了,检查一下显存使用和数据帧生成的情况。

最后会在文件夹目录下生成一个temp.mp4的文件,就是换脸后合成的视频了,发现视频没有声音,画面换的人脸还比较模糊,带有音频的文件保存在start启动之前的路径位置。

常用处理生产方法

只用CPU处理视频。

python 复制代码
python run.py

使用GPU处理视频。

python 复制代码
python run.py --execution-provider cuda  

图片保存jpg格式 。

python 复制代码
python run.py --execution-provider cuda --temp-frame-format jpg

视频高清化处理。

python 复制代码
python run.py --execution-provider cuda --temp-frame-format jpg --frame-processor face_swapper face_enhancer 

处理脸部跳闪。

python 复制代码
python run.py --execution-provider cuda --temp-frame-format jpg --frame-processor face_swapper face_enhancer --similar-face-distance 1.5

指定帧识别人脸并替换,找到指定的帧数,位置人脸指定是从右向左从0开始计算。

python 复制代码
python run.py --execution-provider cuda  --reference-face-position 3  --reference-frame-number 166 --similar-face-distance 1.5

画面预览

超分后的画面预览。

错误解答

问题 urllib.error.HTTPError: HTTP Error 401: Unauthorized

由于下载inswapper_128.onnx'文件没有权限导致的,即没有权限访问蓝色部分网址导致的。这个要自己搜索一下inswapper_128.onnx文件并下载保存到项目的models目录下。

问题 http.client.RemoteDisconnected: Remote end closed connection without response

由于下载GFPGANv1.4.pth没有权限导致的,可以尝试使用一些上网方法下载,或者直接使用别的项目复制过来。如果能正常下载的话模型会自动下载到项目的models文件夹下。

同时还有可能出现的问题模型还有detection_Resnet50_Final.pthparsing_parsenet.pth处理方法都是一样的,上述模型都是用于画面超分使用的。

问题 Could not locate zlibwapi.dll. Please make sure it is in your library path!

是由于cuda缺少一些依赖文件。

自行百度搜索zlibwapi.dll 会得到一个压缩包自行移动文件到你的NVIDIA GPU Computing Toolkit\CUDA目录下。

相关推荐
RTC实战笔记3 天前
实时互动数字人怎么做,才不是一个只会说话的视频?
音视频·数字人·rtc·数字人接入
RTC实战笔记15 天前
Android 实时音视频接入教程:媒体补充增强信息(SEI)
音视频·媒体·rtc
潜创微科技16 天前
HDMI1.3 无线传输芯片方案 空旷 150 米量产级音视频方案
音视频
VidDown16 天前
VidDown 工具站:免费、本地优先的开发者工具箱
javascript·编辑器·音视频·视频编解码·视频
换个昵称都难16 天前
音频格式之WAV
音视频
AI创界者16 天前
PilotTTS 一键整合包(Win/Mac):8G 显存畅跑,实测解锁情绪与副语言的精准控制
人工智能·macos·aigc·音视频
u1521096484916 天前
S.S.Audio PRO A2音频隔离器
嵌入式硬件·音视频·实时音视频·视频编解码·视频
VidDown16 天前
显卡处理视频技术详解:从硬解码到 NVENC,GPU 如何让视频处理起飞?
javascript·编辑器·音视频·视频编解码·视频
EasyDSS16 天前
全能音视频平台/私有化音视频系统EasyDSS!直播/点播/会议/集群对讲一站式落地
音视频
Damon_X16 天前
车载音频复习
音视频