video2x - 视频和图像无损放大工具

video2x集成了多种超分辨率算法(如 Waifu2x、Anime4K、Real-ESRGAN),能够有效提高视频和图像的分辨率,并提供了图形界面(GUI)、Docker 和命令行界面(CLI)的使用方式。

9500 Stars 940 Forks 269 Issues 16 贡献者 AGPL-3.0 License Python 语言

代码: GitHub - k4yt3x/video2x: A machine learning-based video super resolution and frame interpolation framework. Est. Hack the Valley II, 2018.

主页: https://video2x.org/

更多AI开源软件:AI开源 - 小众AI

主要功能

  • 实时处理:Video2x设计为高效运行,即使处理大型视频文件也能保持合理的速度,支持实时或近实时的超分辨率处理。
  • 模型优化:项目作者针对视频超分辨率任务进行了特定的模型优化,使处理后的视频质量得到大幅提升,同时保持较低的计算资源需求。
  • 用户友好:Video2x 提供简单的 API 和命令行接口,开发者和普通用户都可以轻松上手,进行自定义的视频处理。

开始使用

Prerequisites

使用Video2X之前, 确认已经安装了所需的外部依赖,比如GPU驱动.

  • waifu2x-caffe

    • GPU mode: Nvidia graphics card driver
    • cuDNN mode: Nvidia CUDA and cuDNN
  • Other Drivers

    • 其他需要安装的GPU驱动
运行 Video2X (GUI)

最便捷的运行方式就是通过图形界面运行. 提取完整的发布 zip 文件,您将获得这些文件。

*Video2X 发布文件*

只需双击 video2x_gui.exe 即可启动 GUI。

*Video2X 主界面*

然后,将要放大的视频拖到窗口中并选择合适的输出路径。

*Drag and drop file into Video2X GUI*

如果需要,可以调整设置,然后点击底部的开始按钮,升级将开始。现在您只需等待它完成。

*Video2X started processing input files*

运行 Video2X (CLI)
放大图片基本命令

下面的示例命令使用 'waifu2x-caffe' 将视频 'sample-input.mp4' 放大两倍于原始大小。

复制代码
python video2x.py -i sample-input.mp4 -o sample-output.mp4 -r 2 -d waifu2x_caffe
放大图片增强命令

如果您想调整特定于引擎的设置,请在 '--' 后指定相应的参数,或编辑配置文件 'video2x.yaml' 中的相应字段。 **命令行参数将覆盖配置文件中的默认值。**

以下示例添加了为"waifu2x-caffe"启用 TTA。

复制代码
python video2x.py -i sample-input.mp4 -o sample-output.mp4 -r 2 -d waifu2x_caffe -- --tta 1

要查看驱动程序特定设置的帮助页面,请使用 '-d' 选择驱动程序并附加 '-- --help',如下所示。这将打印所有特定于驱动程序的设置和描述。

复制代码
python video2x.py -d waifu2x_caffe -- --help
运行 Video2X (Docker)

Video2X 可以通过 Docker 进行部署。以下命令使用 Waifu2X NCNN Vulkan 将视频"sample_input.mp4"放大两倍,并将放大后的视频输出为"sample_output.mp4"。有关 Video2X Docker 镜像使用的更多详细信息,请参阅 文档.

复制代码
docker run --rm -it --gpus all -v /dev/dri:/dev/dri -v $PWD:/host k4yt3x/video2x:4.6.0 -d waifu2x_ncnn_vulkan -r 2 -i sample_input.mp4 -o sample_output.mp4
相关推荐
DisonTangor16 分钟前
阿里开源Qwen3-Omni-30B-A3B三剑客——Instruct、Thinking 和 Captioner
人工智能·语言模型·开源·aigc
独孤--蝴蝶17 分钟前
AI人工智能-机器学习-第一周(小白)
人工智能·机器学习
西柚小萌新19 分钟前
【深入浅出PyTorch】--上采样+下采样
人工智能·pytorch·python
丁学文武1 小时前
大语言模型(LLM)是“预制菜”? 从应用到底层原理,在到中央厨房的深度解析
人工智能·语言模型·自然语言处理·大语言模型·大模型应用·预制菜
fie88891 小时前
基于MATLAB的声呐图像特征提取与显示
开发语言·人工智能
文火冰糖的硅基工坊2 小时前
[嵌入式系统-100]:常见的IoT(物联网)开发板
人工智能·物联网·架构
刘晓倩2 小时前
实战任务二:用扣子空间通过任务提示词制作精美PPT
人工智能
却道天凉_好个秋2 小时前
OpenCV(七):BGR
opencv·计算机视觉
shut up2 小时前
LangChain - 如何使用阿里云百炼平台的Qwen-plus模型构建一个桌面文件查询AI助手 - 超详细
人工智能·python·langchain·智能体
Hy行者勇哥2 小时前
公司全场景运营中 PPT 的类型、功能与作用详解
大数据·人工智能