video2x - 视频和图像无损放大工具

video2x集成了多种超分辨率算法(如 Waifu2x、Anime4K、Real-ESRGAN),能够有效提高视频和图像的分辨率,并提供了图形界面(GUI)、Docker 和命令行界面(CLI)的使用方式。

9500 Stars 940 Forks 269 Issues 16 贡献者 AGPL-3.0 License Python 语言

代码: GitHub - k4yt3x/video2x: A machine learning-based video super resolution and frame interpolation framework. Est. Hack the Valley II, 2018.

主页: https://video2x.org/

更多AI开源软件:AI开源 - 小众AI

主要功能

  • 实时处理:Video2x设计为高效运行,即使处理大型视频文件也能保持合理的速度,支持实时或近实时的超分辨率处理。
  • 模型优化:项目作者针对视频超分辨率任务进行了特定的模型优化,使处理后的视频质量得到大幅提升,同时保持较低的计算资源需求。
  • 用户友好:Video2x 提供简单的 API 和命令行接口,开发者和普通用户都可以轻松上手,进行自定义的视频处理。

开始使用

Prerequisites

使用Video2X之前, 确认已经安装了所需的外部依赖,比如GPU驱动.

  • waifu2x-caffe

    • GPU mode: Nvidia graphics card driver
    • cuDNN mode: Nvidia CUDA and cuDNN
  • Other Drivers

    • 其他需要安装的GPU驱动
运行 Video2X (GUI)

最便捷的运行方式就是通过图形界面运行. 提取完整的发布 zip 文件,您将获得这些文件。

*Video2X 发布文件*

只需双击 video2x_gui.exe 即可启动 GUI。

*Video2X 主界面*

然后,将要放大的视频拖到窗口中并选择合适的输出路径。

*Drag and drop file into Video2X GUI*

如果需要,可以调整设置,然后点击底部的开始按钮,升级将开始。现在您只需等待它完成。

*Video2X started processing input files*

运行 Video2X (CLI)
放大图片基本命令

下面的示例命令使用 'waifu2x-caffe' 将视频 'sample-input.mp4' 放大两倍于原始大小。

复制代码
python video2x.py -i sample-input.mp4 -o sample-output.mp4 -r 2 -d waifu2x_caffe
放大图片增强命令

如果您想调整特定于引擎的设置,请在 '--' 后指定相应的参数,或编辑配置文件 'video2x.yaml' 中的相应字段。 **命令行参数将覆盖配置文件中的默认值。**

以下示例添加了为"waifu2x-caffe"启用 TTA。

复制代码
python video2x.py -i sample-input.mp4 -o sample-output.mp4 -r 2 -d waifu2x_caffe -- --tta 1

要查看驱动程序特定设置的帮助页面,请使用 '-d' 选择驱动程序并附加 '-- --help',如下所示。这将打印所有特定于驱动程序的设置和描述。

复制代码
python video2x.py -d waifu2x_caffe -- --help
运行 Video2X (Docker)

Video2X 可以通过 Docker 进行部署。以下命令使用 Waifu2X NCNN Vulkan 将视频"sample_input.mp4"放大两倍,并将放大后的视频输出为"sample_output.mp4"。有关 Video2X Docker 镜像使用的更多详细信息,请参阅 文档.

复制代码
docker run --rm -it --gpus all -v /dev/dri:/dev/dri -v $PWD:/host k4yt3x/video2x:4.6.0 -d waifu2x_ncnn_vulkan -r 2 -i sample_input.mp4 -o sample_output.mp4
相关推荐
九章云极AladdinEdu3 分钟前
深度学习优化器进化史:从SGD到AdamW的原理与选择
linux·服务器·开发语言·网络·人工智能·深度学习·gpu算力
dlraba8028 分钟前
Python 实战:票据图像自动矫正技术拆解与落地教程
人工智能·opencv·计算机视觉
过河卒_zh156676628 分钟前
9.13AI简报丨哈佛医学院开源AI模型,Genspark推出AI浏览器
人工智能·算法·microsoft·aigc·算法备案·生成合成类算法备案
程序员ken32 分钟前
深入理解大语言模型(5)-关于token
人工智能·语言模型·自然语言处理
Codebee40 分钟前
OneCode 移动套件多平台适配详细报告
前端·人工智能
sinat_286945191 小时前
Case-Based Reasoning用于RAG
人工智能·算法·chatgpt
许泽宇的技术分享1 小时前
AI时代的内容创作革命:深度解析xiaohongshu-mcp项目的技术创新与实战价值
人工智能
地平线开发者1 小时前
征程 6 灰度图部署链路介绍
人工智能·算法·自动驾驶·汽车
工藤学编程1 小时前
零基础学AI大模型之SpringAI
人工智能
Xy-unu1 小时前
[VL|RIS] RSRefSeg 2
论文阅读·人工智能·transformer·论文笔记·分割