video2x - 视频和图像无损放大工具

video2x集成了多种超分辨率算法(如 Waifu2x、Anime4K、Real-ESRGAN),能够有效提高视频和图像的分辨率,并提供了图形界面(GUI)、Docker 和命令行界面(CLI)的使用方式。

9500 Stars 940 Forks 269 Issues 16 贡献者 AGPL-3.0 License Python 语言

代码: GitHub - k4yt3x/video2x: A machine learning-based video super resolution and frame interpolation framework. Est. Hack the Valley II, 2018.

主页: https://video2x.org/

更多AI开源软件:AI开源 - 小众AI

主要功能

  • 实时处理:Video2x设计为高效运行,即使处理大型视频文件也能保持合理的速度,支持实时或近实时的超分辨率处理。
  • 模型优化:项目作者针对视频超分辨率任务进行了特定的模型优化,使处理后的视频质量得到大幅提升,同时保持较低的计算资源需求。
  • 用户友好:Video2x 提供简单的 API 和命令行接口,开发者和普通用户都可以轻松上手,进行自定义的视频处理。

开始使用

Prerequisites

使用Video2X之前, 确认已经安装了所需的外部依赖,比如GPU驱动.

  • waifu2x-caffe

    • GPU mode: Nvidia graphics card driver
    • cuDNN mode: Nvidia CUDA and cuDNN
  • Other Drivers

    • 其他需要安装的GPU驱动
运行 Video2X (GUI)

最便捷的运行方式就是通过图形界面运行. 提取完整的发布 zip 文件,您将获得这些文件。

*Video2X 发布文件*

只需双击 video2x_gui.exe 即可启动 GUI。

*Video2X 主界面*

然后,将要放大的视频拖到窗口中并选择合适的输出路径。

*Drag and drop file into Video2X GUI*

如果需要,可以调整设置,然后点击底部的开始按钮,升级将开始。现在您只需等待它完成。

*Video2X started processing input files*

运行 Video2X (CLI)
放大图片基本命令

下面的示例命令使用 'waifu2x-caffe' 将视频 'sample-input.mp4' 放大两倍于原始大小。

复制代码
python video2x.py -i sample-input.mp4 -o sample-output.mp4 -r 2 -d waifu2x_caffe
放大图片增强命令

如果您想调整特定于引擎的设置,请在 '--' 后指定相应的参数,或编辑配置文件 'video2x.yaml' 中的相应字段。 **命令行参数将覆盖配置文件中的默认值。**

以下示例添加了为"waifu2x-caffe"启用 TTA。

复制代码
python video2x.py -i sample-input.mp4 -o sample-output.mp4 -r 2 -d waifu2x_caffe -- --tta 1

要查看驱动程序特定设置的帮助页面,请使用 '-d' 选择驱动程序并附加 '-- --help',如下所示。这将打印所有特定于驱动程序的设置和描述。

复制代码
python video2x.py -d waifu2x_caffe -- --help
运行 Video2X (Docker)

Video2X 可以通过 Docker 进行部署。以下命令使用 Waifu2X NCNN Vulkan 将视频"sample_input.mp4"放大两倍,并将放大后的视频输出为"sample_output.mp4"。有关 Video2X Docker 镜像使用的更多详细信息,请参阅 文档.

复制代码
docker run --rm -it --gpus all -v /dev/dri:/dev/dri -v $PWD:/host k4yt3x/video2x:4.6.0 -d waifu2x_ncnn_vulkan -r 2 -i sample_input.mp4 -o sample_output.mp4
相关推荐
格林威21 分钟前
UV紫外相机的简单介绍和场景应用
人工智能·数码相机·计算机视觉·视觉检测·制造·uv·工业相机
番石榴AI1 小时前
自己动手做一款ChatExcel数据分析系统,智能分析 Excel 数据
人工智能·python·数据挖掘·excel
laopeng3011 小时前
基于Spring AI Deep Researcher Agent
java·人工智能·spring
lzptouch1 小时前
数据预处理(音频/图像/视频/文字)及多模态统一大模型输入方案
人工智能·音视频
星期天要睡觉1 小时前
深度学习——循环神经网络(RNN)
人工智能·python·rnn·深度学习·神经网络
jieba121381 小时前
CAA机器学习
人工智能
TextIn智能文档云平台2 小时前
LLM 文档处理:如何让 AI 更好地理解中文 PDF 中的复杂格式?
人工智能·pdf
Blossom.1182 小时前
把AI“撒”进农田:基于极值量化与状态机的1KB边缘灌溉决策树
人工智能·python·深度学习·算法·目标检测·决策树·机器学习
takashi_void2 小时前
本地实现斯坦福小镇(利用大语言模型使虚拟角色自主发展剧情)类似项目“Microverse”
人工智能·语言模型·自然语言处理·godot·游戏程序·斯坦福小镇
zxsz_com_cn2 小时前
设备健康管理大数据平台:工业智能化的核心数据引擎
运维·人工智能