本地视频转文字|video2text

说明

一直想找下视频转文字的工具,都有很多限制,于是自己写了个自用的小工具.反正一般平常工作的时候独立显卡用的也不多,让它跑视频正好.

复制代码
- Video2Text 是一款功能视频转文本工具,集成了 faster_whisper 语音转写引擎和 Ollama + Qwen2.5 智能总结模型。
- 本项目支持多种视频格式(MP4、AVI、MOV、MKV等),可高质量地将视频内容转换为文本,并提供智能总结功能。
- 支持多种输出格式(TXT、SRT、VTT、JSON),具备 GPU 加速和多语言支持能力。
- 项目提供命令行和图形界面两种使用方式,并打包了 Windows 绿色版,无需安装即可使用。
- 使用的语音识别模型large-v3和总结文本模型Qwen2.5可以自己配置切换

源代码已上传github:

https://github.com/fuyouling/video2text

GUI界面

Windows 安装教程

Windows 系统上安装打包好的 video2text 程序的完整步骤。mac和linux的话就自己去拉下源码编译运行

包含的文件

安装包体积较大,已上传至 123 云盘,内含以下组件:

  • Ollama 安装包及模型文件
  • ffmpeg 安装包
  • video2text 绿色版 exe 程序包 video2text_portable_windows_[日期].zip
  • large‑v3 模型文件

请使用支持保留目录结构的解压工具(如 7‑Zip)解压压缩包,确保文件夹结构完整。

连接:

复制代码
『来自123云盘用户喵王龙的分享』video2text
链接:https://1840674647.share.123pan.cn/123pan/7CfNTd-SE7j3?pwd=viWa#
提取码:viWa

安装步骤

  1. 安装 Ollama

    • 运行 Ollama 的 exe 安装程序。
    • models.zip 解压到 C:\Users\%USERNAME%\.ollama 目录下。
    • 开启Ollama,直接打开安装好的程序就行
  2. 安装 ffmpeg

    • 直接运行 ffmpeg 安装程序。
    • 完成后将 ffmpeg 所在目录添加到系统 PATH 环境变量,以便在命令行中直接调用。
    • 运行 ffmpeg -version 检查是否成功显示版本信息。
  3. 部署 video2text

    • 解压 video2text 绿色版 exe 程序包。
    • large‑v3 模型文件解压到 video2text.exe 所在目录下的 models 子文件夹中。

完成以上步骤后,即可在 Windows 环境下运行 video2text,并使用 large‑v3 模型进行视频转文本。

相关推荐
程序员榴莲14 小时前
Python 中的 @property:像访问属性一样调用方法
开发语言·前端·python
坐吃山猪14 小时前
【Nanobot】README04_LEVEL2 提供商系统设计
python·源码·agent·nanobot
坐吃山猪14 小时前
【Nanobot】README09_LEVEL4 添加新聊天渠道
开发语言·网络·python·源码·nanobot
Mr.朱鹏14 小时前
9-检索增强生成RAG详解
python·gpt·langchain·大模型·llm·rag
shehuiyuelaiyuehao14 小时前
算法27,二维前缀和
开发语言·python·算法
Soari14 小时前
告别商业收费与审核枷锁:深度拆解 Open-Generative-AI,构建 MIT 开源、零过滤的私有化视频生成工作站
人工智能·开源·音视频·私有化部署·sora·ai视频生成·generative-ai
码界筑梦坊14 小时前
125-基于Flask的客户购物偏好数据可视化分析系统
python·信息可视化·flask·毕业设计
leon_teacher14 小时前
HarmonyOS 6 实战:基于 Ads Kit 的插屏广告(视频 + 图片)架构与实现全解析
架构·音视频·harmonyos
测试秃头怪14 小时前
接口测试与常用接口测试工具详解
自动化测试·软件测试·python·测试工具·职场和发展·测试用例·接口测试
坐吃山猪14 小时前
【Nanobot】README03_LEVEL2_工具系统架构
python·源码·agent·nanobot