政安晨【零基础玩转开源AI项目】video-subtitle-remover 去除视频字幕水印(图像也可以)(基于Ubuntu Linux系统)

政安晨的个人主页:************政安晨****************

欢迎 👍点赞✍评论⭐收藏

希望政安晨的博客能够对您有所裨益,如有不足之处,欢迎在评论区提出指正!

刷到我这篇文章的小伙伴有福了,免费好用的视频去水印、去字幕的开源AI工具来了。

目录

项目简介

项目地址

启动运行

解决问题


项目简介

Video-subtitle-remover (VSR) 是一款基于AI技术,将视频中的硬字幕去除的软件。 主要实现了以下功能:

  • 无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件
  • 通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除)
  • 支持自定义字幕位置,仅去除定义位置中的字幕(传入位置)
  • 支持全视频自动去除所有文本(不传入位置)
  • 支持多选图片批量去除水印文本

项目地址

https://github.com/YaoFANGUK/video-subtitle-removerhttps://github.com/YaoFANGUK/video-subtitle-remover

启动运行

基于Ubuntu系统,下载docker直接运行。

因为我是40的N卡,执行如下命令下载docker镜像:

复制代码
  # Nvidia 40系显卡
  docker run -it --name vsr --gpus all eritpchy/video-subtitle-remover:1.1.1-cuda12.6

下载好镜像后,直接运行:

复制代码
sudo docker rm -f vsr && sudo docker run -it   --name vsr   -e DISPLAY=$DISPLAY   -v /tmp/.X11-unix:/tmp/.X11-unix   -w /vsr   eritpchy/video-subtitle-remover:1.1.1-cuda12.6 python gui.py

但是,相信我,在这个过程中你一定会遇到很多问题,我们一点点解决。

解决问题

首先,这个docker里是没有GUI的,所以,启动docker之前,请执行:

复制代码
xhost +local:docker

要注意的是,结束这个docker之后,一定要执行:

复制代码
xhost -local:

来关闭权限,保证系统安全。

你可以查看一下你的docker镜像:

复制代码
sudo docker images

其中,你可以看到这个就对了:

然后仿照下面命令执行:

复制代码
sudo docker rm -f vsr && sudo docker run -it --name vsr -e DISPLAY=$DISPLAY -v /tmp/.X11-unix:/tmp/.X11-unix -v $(pwd)/ZachProj/asserts:/vsr/test -w /vsr eritpchy/video-subtitle-remover:1.1.1-cuda12.6 python gui.py

注意:-v $(pwd)/ZachProj/asserts:/vsr/test 这一段中要ZachProj/asserts改成你宿主机实际的工作目录。

然后,你就亲切地打开了这个AI工具的图形端:

选择好你要处理的视频文件,然后,处理它。


剩下的我就不多说了,能够掌握的小伙伴自己体会,应该会帮你节省一些...

相关推荐
智算菩萨2 分钟前
【Generative AI For Autonomous Driving】1 生成式AI重塑自动驾驶的技术浪潮与体系化挑战
论文阅读·人工智能·深度学习·机器学习·ai·自动驾驶
程序员Better5 分钟前
一口气拆穿Skill/MCP/RAG/Agent/OpenClaw底层逻辑
人工智能·开源·agent
智算菩萨16 分钟前
【Generative AI For Autonomous Driving】7 生成式AI驱动自动驾驶的未来图景:开放挑战、社会机遇与技术展望
论文阅读·人工智能·深度学习·机器学习·ai·自动驾驶
_Twink1e22 分钟前
2023-2026年计算机视觉领域期刊整理汇总
人工智能·计算机视觉
AI英德西牛仔27 分钟前
deepseek怎么导出文档
人工智能·ai·chatgpt·deepseek·ds随心转
冰西瓜60037 分钟前
深度学习的数学原理(十九)—— 视觉Transformer(ViT)实战
人工智能·深度学习·transformer
碳基硅坊39 分钟前
Qwen3.5-4B 微调实战:LLaMA-Factory 打造医疗AI助手
人工智能·qwen·模型微调
GISer_Jing41 分钟前
从CLI到GUI桌面应用——前端工程化进阶之路
前端·人工智能·aigc·交互
HIT_Weston43 分钟前
21、【Agent】【OpenCode】源码构建(项目构建)
人工智能·agent·opencode
0x33043 分钟前
LangGraph Studio 可视化调试指南:从零配置 LangGraph + LangSmith 智能体工作流
人工智能