python 视频硬字幕去除 内嵌字幕去除工具 vsr

项目简介

开源地址:https://github.com/YaoFANGUK/video-subtitle-remover

Video-subtitle-remover (VSR) 是一款基于AI技术,将视频中的硬字幕去除的软件。

主要实现了以下功能:

  • 无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件
  • 通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除)
  • 支持自定义字幕位置,仅去除定义位置中的字幕(传入位置)
  • 支持全视频自动去除所有文本(不传入位置)

直接下载压缩包解压运行,如果不能运行再按照下面的教程,尝试源码安装conda环境运行

下载地址:

Windows GPU版本v1.0.0(GPU):

仅供具有Nvidia显卡的用户使用(AMD的显卡不行)

演示

源码使用说明

无Nvidia显卡请勿使用本项目,最低配置:

GPU:GTX 1060或以上显卡

CPU: 支持AVX指令集

1. 下载安装Miniconda
2. 创建并激活虚机环境

(1)切换到源码所在目录:

shell 复制代码
cd <源码所在目录>

例如:如果你的源代码放在D盘的tools文件下,并且源代码的文件夹名为video-subtitle-remover,就输入 cd D:/tools/video-subtitle-remover-main

(2)创建激活conda环境

shell 复制代码
conda create -n videoEnv python=3.8
shell 复制代码
conda activate videoEnv
3. 安装依赖文件

请确保你已经安装 python 3.8+,使用conda创建项目虚拟环境并激活环境 (建议创建虚拟环境运行,以免后续出现问题)

  • 安装CUDA和cuDNN

    Linux用户

    (1) 下载CUDA 11.7
    复制代码
    wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run
    (2) 安装CUDA 11.7
    复制代码
    sudo sh cuda_11.7.0_515.43.04_linux.run
    1. 输入accept

    2. 选中CUDA Toolkit 11.7(如果你没有安装nvidia驱动则选中Driver,如果你已经安装了nvidia驱动请不要选中driver),之后选中install,回车

    3. 添加环境变量

    在 ~/.bashrc 加入以下内容

    复制代码
    # CUDA
    export PATH=/usr/local/cuda-11.7/bin${PATH:+:${PATH}}
    export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

    使其生效

    复制代码
    source ~/.bashrc
    (3) 下载cuDNN 8.4.1

    国内:cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive.tar.xz 提取码:57mg

    国外:cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive.tar.xz

    (4) 安装cuDNN 8.4.1
    复制代码
     tar -xf cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive.tar.xz
     mv cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive cuda
     sudo cp ./cuda/include/* /usr/local/cuda-11.7/include/
     sudo cp ./cuda/lib/* /usr/local/cuda-11.7/lib64/
     sudo chmod a+r /usr/local/cuda-11.7/lib64/*
     sudo chmod a+r /usr/local/cuda-11.7/include/*

    Windows用户

    (1) 下载CUDA 11.7

    cuda_11.7.0_516.01_windows.exe

    (2) 安装CUDA 11.7
    (3) 下载cuDNN 8.2.4

    cudnn-windows-x64-v8.2.4.15.zip

    (4) 安装cuDNN 8.2.4

    将cuDNN解压后的cuda文件夹中的bin, include, lib目录下的文件复制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7\对应目录下

  • 安装GPU版本Paddlepaddle:

    • windows:

      shell 复制代码
      python -m pip install paddlepaddle-gpu==2.4.2.post117 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html
    • Linux:

      shell 复制代码
      python -m pip install paddlepaddle-gpu==2.4.2.post117 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
  • 安装GPU版本Pytorch:

    shell 复制代码
    conda install pytorch==2.0.1 torchvision==0.15.2 pytorch-cuda=11.7 -c pytorch -c nvidia

    或者使用

    shell 复制代码
    pip install torch==2.0.1 torchvision==0.15.2 --index-url https://download.pytorch.org/whl/cu117
  • 安装其他依赖:

    shell 复制代码
    pip install -r requirements.txt
4. 运行程序
  • 运行图形化界面
shell 复制代码
python gui.py
  • 运行命令行版本(CLI)
shell 复制代码
python ./backend/main.py

常见问题

  1. CondaHTTPError

将项目中的.condarc放在用户目录下(C:/Users/<你的用户名>),如果用户目录已经存在该文件则覆盖

解决方案:https://zhuanlan.zhihu.com/p/260034241

  1. 7z文件解压错误

解决方案:升级7-zip解压程序到最新版本

相关推荐
无人机90139 分钟前
Delphi 网络编程实战:TIdTCPClient 与 TIdTCPServer 类深度解析
java·开发语言·前端
froginwe111 小时前
CSS 图像拼合技术
开发语言
计算机安禾1 小时前
【数据结构与算法】第22篇:线索二叉树(Threaded Binary Tree)
c语言·开发语言·数据结构·学习·算法·链表·visual studio code
qq_196976171 小时前
python的sql解析库-sqlparse
数据库·python·sql
sweetone1 小时前
安桥CR-245BT 微型桌面音响不开机小修
经验分享·音视频
:mnong1 小时前
Superpowers 项目设计分析
java·c语言·c++·python·c#·php·skills
a里啊里啊1 小时前
测试开发面试题
开发语言·chrome·python·xpath
豆沙糕2 小时前
Python异步编程从入门到实战:结合RAG流式回答全解析
开发语言·python·面试
信奥胡老师2 小时前
P1255 数楼梯
开发语言·数据结构·c++·学习·算法
A.A呐2 小时前
【C++第二十一章】set与map封装
开发语言·c++