本地视频转文字免费工具

video2text Windows 安装指南(本地视频转文字免费工具)

关键词:video2text、Windows 安装、免费、本地视频转文字、Whisper large‑v3、Ollama、NVIDIA API、GPU 加速

目录

  • [video2text Windows 安装指南(本地视频转文字免费工具)](#video2text Windows 安装指南(本地视频转文字免费工具))
    • 目录
    • [1. 项目概述](#1. 项目概述)
    • [2. 系统与硬件要求](#2. 系统与硬件要求)
    • [3. 必备软件与依赖](#3. 必备软件与依赖)
    • [4. 下载准备](#4. 下载准备)
    • [5. 安装步骤](#5. 安装步骤)
      • [5.1 解压绿色版](#5.1 解压绿色版)
      • [5.2 放入 Whisper 模型](#5.2 放入 Whisper 模型)
      • [5.3 配置 .env(可选)](#5.3 配置 .env(可选))
      • [5.4 安装 Ollama(本地模型,仅在需要本地摘要时)](#5.4 安装 Ollama(本地模型,仅在需要本地摘要时))
      • [5.5 (可选)自动下载模型](#5.5 (可选)自动下载模型)
    • [6. 快速验证](#6. 快速验证)
    • [7. 主界面GUI](#7. 主界面GUI)
    • [8. 常见问题 (FAQ)](#8. 常见问题 (FAQ))
    • [9. 参考资源](#9. 参考资源)

1. 项目概述

video2text 是一个基于 Whisper large‑v3 的本地视频转文字工具,支持:

  • 免费、无限制 时长的转写
  • GPU 加速 (NVIDIA 显卡)或 CPU 兼容模式
  • OllamaNVIDIA 大模型摘要生成
  • 绿色版(免安装)GUI 与 CLI 双界面

2. 系统与硬件要求

项目 最低要求 推荐配置
操作系统 Windows 10 64 位 Windows 11 64 位
磁盘空间 20 GB 可用 30 GB 以上(含模型)
内存 8 GB 16 GB+
显卡 任意(CPU 可用但慢) NVIDIA GPU(6 GB+ 显存)+ CUDA 12.0+

提示:AMD 显卡目前不支持 GPU 加速,仅能使用 CPU。

3. 必备软件与依赖

  • NVIDIA 驱动 (CUDA 12.0+)并确认 nvidia-smi 正常
  • Ollama (本地大模型)官方下载页(可选)

4. 下载准备

  1. 前往 123 云盘 (或项目 Release 页面)下载完整压缩包 video2text_portable_windows_*.zip
    • 示例链接:https://1840674647.share.123pan.cn/123pan/7CfNTd-SE7j3?pwd=viWa(提取码 viWa
  2. 网盘中包含 large‑v3 模型压缩包(约 3 GB)和 Ollama 预置模型(约 4.7 GB)。

建议使用高速网络,完整下载约 10 GB。

5. 安装步骤

以下步骤假设解压目录为 D:\video2text,可自行替换为任意路径。

5.1 解压绿色版

powershell 复制代码
# PowerShell 示例
Expand-Archive -Path "C:\Users\YourName\Downloads\video2text_portable_windows_xxx.zip" -DestinationPath "D:\video2text"

目录结构应如下:

复制代码
D:\video2text\
├─ video2text.exe
├─ video2text.bat
├─ config.ini
├─ .env (手动创建)
├─ models\
├─ output\
├─ logs\
└─ README.md

5.2 放入 Whisper 模型

powershell 复制代码
Expand-Archive -Path "C:\Users\YourName\Downloads\large-v3.zip" -DestinationPath "D:\video2text\models"

确保模型目录为 D:\video2text\models\large-v3\,内部包含 config.jsonmodel.bin 等文件。

5.3 配置 .env(可选)

  • NVIDIA API :在 D:\video2text\.env 中写入

    复制代码
    NVIDIA_API_KEY=nvapi-你的密钥

5.4 安装 Ollama(本地模型,仅在需要本地摘要时)

  1. 双击 OllamaSetup.exe 完成安装。

  2. 将下载好的 models.zip 解压至 %USERPROFILE%\.ollama\,保持以下结构:

    C:\Users\YourName.ollama
    └─ models
    ├─ blobs
    └─ manifests\

5.5 (可选)自动下载模型

首次启动 video2text.exe 时若未检测到 models\large-v3,程序会尝试从 HuggingFace 自动下载。可在 config.ini[network] proxy 中配置代理。

6. 快速验证

  1. 启动 GUI :双击 video2text.exe(或 video2text.bat)。
  2. 转写测试 :在界面左上角选中一段短视频(10--20 秒),点击 仅转写。完成后在右侧面板查看转写文本。
  3. 摘要测试 (已配置 NVIDIA API 或 Ollama):点击 仅总结,确认生成 Markdown 摘要。

CLI 验证示例:

powershell 复制代码
.\video2text.exe transcribe "D:\sample\demo.mp4" -o output
.\video2text.exe summarize output\demo.txt -o output

若出现错误,请检查 logs/app.log 获取详细信息。

7. 主界面GUI

8. 常见问题 (FAQ)

问题 解决方案
显卡不被识别 确认已安装最新 NVIDIA 驱动,运行 nvidia-smi 能显示 GPU 信息。
模型下载非常慢 config.ini[network] 区块配置 HTTP/HTTPS 代理。
NVIDIA_API_KEY 无效 请在 NVIDIA Build 平台重新生成 API Key,确保无空格或换行。
Ollama 启动失败 检查系统防火墙是否拦截 127.0.0.1:11434,或重新安装 Ollama。

9. 参考资源


本指南遵循 SEO 最佳实践,使用目标关键词、结构化标题、表格与代码块,便于搜索引擎快速索引并提升自然流量。

相关推荐
用户83562907805110 小时前
Python 操作 PDF 附件:添加、查看与管理指南
后端·python
宇宙之一粟17 小时前
乐企版式文件生成平台
java·后端·python
学测绘的小杨1 天前
CompassFusion:一个从 GNSS 到 GNSS/INS 组合导航的独立工程包
python
zzzzzz3102 天前
当产品经理说这个很简单:我用Python自动化处理奇葩需求的实战指南
python·pycharm·产品经理
雪隐2 天前
个人电脑玩AI-06让5060 Ti给你打工——不光能画画,Qwen3-TTS还能学人说话,连我老板都信了!
人工智能·后端·python
兵慌码乱2 天前
面向桌面端的资产管理系统分层架构设计与核心模块实现
python·系统架构·sqlite·pyqt5·数据库设计·桌面应用开发·mvc架构
hboot2 天前
AI工程师第三课 - 机器学习基础
python·scikit-learn·kaggle
顾林海2 天前
Agent入门阶段-编程基础-Python:流程控制
python·agent·ai编程
呱呱复呱呱3 天前
Django CBV 源码解读:一个请求是怎么找到你的 get() 方法的
python·django
曲幽3 天前
刚部署的 LibreTranslate 频频翻车?我掏出了 20 年前的 StarDict 词典,用 FastAPI 搭了个本地词典翻译 API
python·fastapi·web·translate·goldendict·libretranslate·stardict·pystardict