video2x - 视频和图像无损放大工具

video2x集成了多种超分辨率算法(如 Waifu2x、Anime4K、Real-ESRGAN),能够有效提高视频和图像的分辨率,并提供了图形界面(GUI)、Docker 和命令行界面(CLI)的使用方式。

9500 Stars 940 Forks 269 Issues 16 贡献者 AGPL-3.0 License Python 语言

代码: GitHub - k4yt3x/video2x: A machine learning-based video super resolution and frame interpolation framework. Est. Hack the Valley II, 2018.

主页: https://video2x.org/

更多AI开源软件:AI开源 - 小众AI

主要功能

  • 实时处理:Video2x设计为高效运行,即使处理大型视频文件也能保持合理的速度,支持实时或近实时的超分辨率处理。
  • 模型优化:项目作者针对视频超分辨率任务进行了特定的模型优化,使处理后的视频质量得到大幅提升,同时保持较低的计算资源需求。
  • 用户友好:Video2x 提供简单的 API 和命令行接口,开发者和普通用户都可以轻松上手,进行自定义的视频处理。

开始使用

Prerequisites

使用Video2X之前, 确认已经安装了所需的外部依赖,比如GPU驱动.

  • waifu2x-caffe

    • GPU mode: Nvidia graphics card driver
    • cuDNN mode: Nvidia CUDA and cuDNN
  • Other Drivers

    • 其他需要安装的GPU驱动
运行 Video2X (GUI)

最便捷的运行方式就是通过图形界面运行. 提取完整的发布 zip 文件,您将获得这些文件。

*Video2X 发布文件*

只需双击 video2x_gui.exe 即可启动 GUI。

*Video2X 主界面*

然后,将要放大的视频拖到窗口中并选择合适的输出路径。

*Drag and drop file into Video2X GUI*

如果需要,可以调整设置,然后点击底部的开始按钮,升级将开始。现在您只需等待它完成。

*Video2X started processing input files*

运行 Video2X (CLI)
放大图片基本命令

下面的示例命令使用 'waifu2x-caffe' 将视频 'sample-input.mp4' 放大两倍于原始大小。

复制代码
python video2x.py -i sample-input.mp4 -o sample-output.mp4 -r 2 -d waifu2x_caffe
放大图片增强命令

如果您想调整特定于引擎的设置,请在 '--' 后指定相应的参数,或编辑配置文件 'video2x.yaml' 中的相应字段。 **命令行参数将覆盖配置文件中的默认值。**

以下示例添加了为"waifu2x-caffe"启用 TTA。

复制代码
python video2x.py -i sample-input.mp4 -o sample-output.mp4 -r 2 -d waifu2x_caffe -- --tta 1

要查看驱动程序特定设置的帮助页面,请使用 '-d' 选择驱动程序并附加 '-- --help',如下所示。这将打印所有特定于驱动程序的设置和描述。

复制代码
python video2x.py -d waifu2x_caffe -- --help
运行 Video2X (Docker)

Video2X 可以通过 Docker 进行部署。以下命令使用 Waifu2X NCNN Vulkan 将视频"sample_input.mp4"放大两倍,并将放大后的视频输出为"sample_output.mp4"。有关 Video2X Docker 镜像使用的更多详细信息,请参阅 文档.

复制代码
docker run --rm -it --gpus all -v /dev/dri:/dev/dri -v $PWD:/host k4yt3x/video2x:4.6.0 -d waifu2x_ncnn_vulkan -r 2 -i sample_input.mp4 -o sample_output.mp4
相关推荐
Kyrie6781 小时前
SkillOpt:把 Agent 的技能文件当作可训练参数
人工智能
leeyi2 小时前
可观测性:Langfuse、Langsmith 集成
aigc·agent·ai编程
冬奇Lab2 小时前
Workflow 系列(07):工程化与版本管理——Workflow 的 CI/CD
人工智能·工作流引擎
xiaoshuai10242 小时前
【AI 研发实战】3 个人两个月交付 512 个功能,我沉淀了这套 AI 命令体系
ai编程
两万五千个小时2 小时前
Claude Code 上下文管理(一):为什么 Agent 会"失忆"?
人工智能·架构·开源
两万五千个小时2 小时前
Claude Code 上下文管理(二):零 Token 消耗的压缩三板斧
人工智能·程序员·开源
冬奇Lab2 小时前
每日一个开源项目(第150篇):caveman - 为什么用很多 token,少 token 也行——给 AI Agent 装上穴居人嘴巴
人工智能·开源·资讯
ch_09182 小时前
从0构建SDK第4节:实现 ReflectionAgent 的自我反思循环
typescript·agent·ai编程
贵慜_Derek2 小时前
MAI-04|干净数据在工程上意味着什么:MAI 预训练数据治理
人工智能·算法·llm
feelmylife592 小时前
Agent 记忆设计架构 — 分层记忆:什么时候该记住,什么时候该忘记
人工智能