Deep-Live-Cam -面部交换、视频深度伪造

文章目录


一、关于 Deep-Live-Cam


只需单击一下,只需一张图像即可进行实时 面部交换 和 视频深度伪造。



免责声明

该软件旨在 为人工智能生成的媒体行业做出富有成效的贡献。它旨在帮助艺术家 完成诸如为自定义角色制作动画 或将它们用作服装模型等任务。

我们意识到 不道德应用的可能性,并致力于采取预防措施。内置检查可防止程序处理 不适当的媒体(裸体、图形内容、战争镜头等敏感材料)。我们将继续负责任地开发这个项目,遵守法律和道德。如果法律要求,我们可能会关闭该项目或添加水印。

用户应负责任和合法地使用本软件。如果使用真人的脸,请征得他们的同意,并在在线分享时明确将任何输出标记为Deep false。我们不对最终用户的行为负责。


二、安装(Windows/Nvidia)

下载最新的预构建版本,支持CUDA-无需手动安装/下载。


安装(手动)

请注意,安装需要技术技能,不适合初学者,请考虑下载预构建的。在discord服务器上讨论之前,请不要在GitHub上打开平台和安装相关问题。


基本安装(CPU)

这更有可能在您的计算机上工作,但会因为它使用CPU而变慢。

1、设置您的平台

2、克隆存储库

复制代码
https://github.com/hacksider/Deep-Live-Cam.git

3、下载模型

1)GFPGANv1.4

2)inswapper_128_fp16. onnx(注意:如果遇到问题,请使用此替换版本

将这些文件放在"模型"文件夹中。


4、安装依赖项

我们强烈建议使用venv来避免问题。

shell 复制代码
pip install -r requirements.txt

对于macOS: 安装或升级python-tk包:

shell 复制代码
brew install python-tk@3.10

运行: 如果你没有GPU,你可以使用python run.py运行Deep-Live-Cam。


GPU加速(可选)


CUDA执行提供商(Nvidia)

1、安装CUDA Toolkit 11.8

2、安装依赖项:

shell 复制代码
pip uninstall onnxruntime onnxruntime-gpu
pip install onnxruntime-gpu==1.16.3

3、用法:

shell 复制代码
python run.py --execution-provider cuda

CoreML执行提供商(苹果 Silicon)

1、安装依赖项:

shell 复制代码
pip uninstall onnxruntime onnxruntime-silicon
pip install onnxruntime-silicon==1.13.1

2、用法:

shell 复制代码
python run.py --execution-provider coreml

CoreML执行提供程序(Apple Legacy)

1、安装依赖项:

shell 复制代码
pip uninstall onnxruntime onnxruntime-coreml
pip install onnxruntime-coreml==1.13.1

2、用法:

shell 复制代码
python run.py --execution-provider coreml

DirectML执行提供程序(Windows)

1、安装依赖项:

shell 复制代码
pip uninstall onnxruntime onnxruntime-directml
pip install onnxruntime-directml==1.15.1

2、用法:

shell 复制代码
python run.py --execution-provider directml

OpenVINO™执行提供程序(英特尔)

1、安装依赖项:

shell 复制代码
pip uninstall onnxruntime onnxruntime-openvino
pip install onnxruntime-openvino==1.15.0

2、用法:

shell 复制代码
python run.py --execution-provider openvino

三、用法


1、图像/视频模式

  • 执行python run.py
  • 选择源人脸图像和目标图像/视频。
  • 单击"开始"。
  • 输出将保存在以目标视频命名的目录中。

2、网络摄像头模式

  • 执行python run.py
  • 选择源人脸图像。
  • 点击"直播"。
  • 等待预览出现(10-30秒)。
  • 使用OBS等屏幕捕获工具进行流式传输。
  • 要更改面部,请选择新的源图像。


四、特点


可调整大小的预览窗口

使用--live-resizable参数动态提高性能。


人脸映射

动态跟踪和更换面孔。


源视频:


启用人脸映射:


绘制面孔:


See the Magic!


实时观看电影:


五、命令行参数

shell 复制代码
options:
  -h, --help                                               show this help message and exit
  -s SOURCE_PATH, --source SOURCE_PATH                     select a source image
  -t TARGET_PATH, --target TARGET_PATH                     select a target image or video
  -o OUTPUT_PATH, --output OUTPUT_PATH                     select output file or directory
  --frame-processor FRAME_PROCESSOR [FRAME_PROCESSOR ...]  frame processors (choices: face_swapper, face_enhancer, ...)
  --keep-fps                                               keep original fps
  --keep-audio                                             keep original audio
  --keep-frames                                            keep temporary frames
  --many-faces                                             process every face
  --map-faces                                              map source target faces
  --nsfw-filter                                            filter the NSFW image or video
  --video-encoder {libx264,libx265,libvpx-vp9}             adjust output video encoder
  --video-quality [0-51]                                   adjust output video quality
  --live-mirror                                            the live camera display as you see it in the front-facing camera frame
  --live-resizable                                         the live camera frame is resizable
  --max-memory MAX_MEMORY                                  maximum amount of RAM in GB
  --execution-provider {cpu} [{cpu} ...]                   available execution provider (choices: cpu, ...)
  --execution-threads EXECUTION_THREADS                    number of execution threads
  -v, --version                                            show program's version number and exit

寻找CLI模式?使用 -s/--source 参数将使运行程序处于cli模式。


WSL2 Ubuntu上的网络摄像头模式(可选)


未来更新和路线图

有关最新的实验版本和功能,请参阅实验分支

待办事项:

  • 为Web应用程序/服务开发版本
  • 加速模型加载
  • 加快实时人脸交换
  • 支持多张人脸
  • 桌面应用程序的UI/用户体验增强

这是我们空闲时间开发的开源项目。更新可能会延迟。


提示和链接:


Credits


2024-11-14(四)

相关推荐
高山流水&上善4 小时前
基于BERT情感分析与多维度可视化的B站热门视频评论分析系统
人工智能·bert·音视频
阿酷tony5 小时前
如何做视频课程的报名观看?实现报名后,才能观看视频?
音视频
福大大架构师每日一题5 小时前
ollama v0.20.0 更新:Gemma 4 全家桶发布,音频、视觉、MoE、BPE 支持全面升级
音视频·ollama
Flamingˢ1 天前
ZYNQ + OV5640 + HDMI 视频系统调试记录:一次 RGB888 与 RGB565 引发的黑屏问题
arm开发·嵌入式硬件·fpga开发·vim·音视频
Flamingˢ1 天前
YNQ + OV5640 视频系统开发(二):OV5640_Data IP 核源码解析
arm开发·嵌入式硬件·网络协议·tcp/ip·fpga开发·vim·音视频
Flamingˢ1 天前
ZYNQ + OV5640 视频系统开发(三):AXI VDMA 帧缓存原理
arm开发·嵌入式硬件·fpga开发·vim·音视频
Hello World . .1 天前
Linux:Linux命令行音视频播放器
linux·音视频
飞翔的SA1 天前
MLX‑VLM :Mac本地跑通多模态大模型的开源项目!让图片、音频、视频理解一键上手
人工智能·python·macos·音视频
愚公搬代码2 天前
【愚公系列】《剪映+DeepSeek+即梦:短视频制作》046-转场:短视频一气呵成的秘密(什么是转场)
人工智能·音视频
PiaoShiSun2 天前
小米手机浏览器缓存视频如何导出
缓存·智能手机·音视频