本地视频转文字免费工具

video2text Windows 安装指南（本地视频转文字免费工具）

关键词：video2text、Windows 安装、免费、本地视频转文字、Whisper large‑v3、Ollama、NVIDIA API、GPU 加速

[video2text Windows 安装指南（本地视频转文字免费工具）](#video2text Windows 安装指南（本地视频转文字免费工具）)
- 目录
- [1. 项目概述](#1. 项目概述)
- [2. 系统与硬件要求](#2. 系统与硬件要求)
- [3. 必备软件与依赖](#3. 必备软件与依赖)
- [4. 下载准备](#4. 下载准备)
- [5. 安装步骤](#5. 安装步骤)
  - [5.1 解压绿色版](#5.1 解压绿色版)
  - [5.2 放入 Whisper 模型](#5.2 放入 Whisper 模型)
  - [5.3 配置 .env（可选）](#5.3 配置 .env（可选）)
  - [5.4 安装 Ollama（本地模型，仅在需要本地摘要时）](#5.4 安装 Ollama（本地模型，仅在需要本地摘要时）)
  - [5.5 （可选）自动下载模型](#5.5 （可选）自动下载模型)
- [6. 快速验证](#6. 快速验证)
- [7. 主界面GUI](#7. 主界面GUI)
- [8. 常见问题 (FAQ)](#8. 常见问题 (FAQ))
- [9. 参考资源](#9. 参考资源)

1. 项目概述

video2text 是一个基于 Whisper large‑v3 的本地视频转文字工具，支持：

免费、无限制 时长的转写
GPU 加速 （NVIDIA 显卡）或 CPU 兼容模式
Ollama 与 NVIDIA 大模型摘要生成
绿色版（免安装）GUI 与 CLI 双界面

2. 系统与硬件要求

项目	最低要求	推荐配置
操作系统	Windows 10 64 位	Windows 11 64 位
磁盘空间	20 GB 可用	30 GB 以上（含模型）
内存	8 GB	16 GB+
显卡	任意（CPU 可用但慢）	NVIDIA GPU（6 GB+ 显存）+ CUDA 12.0+

提示：AMD 显卡目前不支持 GPU 加速，仅能使用 CPU。

3. 必备软件与依赖

NVIDIA 驱动 （CUDA 12.0+）并确认 nvidia-smi 正常
Ollama （本地大模型）官方下载页（可选）

4. 下载准备

前往 123 云盘 （或项目 Release 页面）下载完整压缩包 video2text_portable_windows_*.zip。
- 示例链接：https://1840674647.share.123pan.cn/123pan/7CfNTd-SE7j3?pwd=viWa（提取码 viWa）
网盘中包含 large‑v3 模型压缩包（约 3 GB）和 Ollama 预置模型（约 4.7 GB）。

建议使用高速网络，完整下载约 10 GB。

5. 安装步骤

以下步骤假设解压目录为 D:\video2text，可自行替换为任意路径。

5.1 解压绿色版

powershell 复制代码

# PowerShell 示例
Expand-Archive -Path "C:\Users\YourName\Downloads\video2text_portable_windows_xxx.zip" -DestinationPath "D:\video2text"

目录结构应如下：

复制代码

D:\video2text\
├─ video2text.exe
├─ video2text.bat
├─ config.ini
├─ .env (手动创建)
├─ models\
├─ output\
├─ logs\
└─ README.md

5.2 放入 Whisper 模型

powershell 复制代码

Expand-Archive -Path "C:\Users\YourName\Downloads\large-v3.zip" -DestinationPath "D:\video2text\models"

确保模型目录为 D:\video2text\models\large-v3\，内部包含 config.json、model.bin 等文件。

5.3 配置 `.env`（可选）

NVIDIA API ：在 D:\video2text\.env 中写入
复制代码
```
NVIDIA_API_KEY=nvapi-你的密钥
```

5.4 安装 Ollama（本地模型，仅在需要本地摘要时）

双击 OllamaSetup.exe 完成安装。
将下载好的 models.zip 解压至 %USERPROFILE%\.ollama\，保持以下结构：

C:\Users\YourName.ollama
└─ models
├─ blobs
└─ manifests\

5.5 （可选）自动下载模型

首次启动 video2text.exe 时若未检测到 models\large-v3，程序会尝试从 HuggingFace 自动下载。可在 config.ini 的 [network] proxy 中配置代理。

6. 快速验证

启动 GUI ：双击 video2text.exe（或 video2text.bat）。
转写测试 ：在界面左上角选中一段短视频（10--20 秒），点击 仅转写。完成后在右侧面板查看转写文本。
摘要测试 （已配置 NVIDIA API 或 Ollama）：点击 仅总结，确认生成 Markdown 摘要。

CLI 验证示例：

powershell 复制代码

.\video2text.exe transcribe "D:\sample\demo.mp4" -o output
.\video2text.exe summarize output\demo.txt -o output

若出现错误，请检查 logs/app.log 获取详细信息。

7. 主界面GUI

8. 常见问题 (FAQ)

问题	解决方案
显卡不被识别	确认已安装最新 NVIDIA 驱动，运行 `nvidia-smi` 能显示 GPU 信息。
模型下载非常慢	在 `config.ini` 的 `[network]` 区块配置 HTTP/HTTPS 代理。
`NVIDIA_API_KEY` 无效	请在 NVIDIA Build 平台重新生成 API Key，确保无空格或换行。
Ollama 启动失败	检查系统防火墙是否拦截 `127.0.0.1:11434`，或重新安装 Ollama。

9. 参考资源

GitHub 项目主页 -- https://github.com/fuyouling/video2text
Whisper large‑v3 模型 -- https://huggingface.co/models/large-v3
Ollama 官方文档 -- https://docs.ollama.com/
NVIDIA Build -- https://build.nvidia.com/

本指南遵循 SEO 最佳实践，使用目标关键词、结构化标题、表格与代码块，便于搜索引擎快速索引并提升自然流量。

本地视频转文字免费工具

video2text Windows 安装指南（本地视频转文字免费工具）

目录

1. 项目概述

2. 系统与硬件要求

3. 必备软件与依赖

4. 下载准备

5. 安装步骤

5.1 解压绿色版

5.2 放入 Whisper 模型

5.3 配置 .env（可选）

5.4 安装 Ollama（本地模型，仅在需要本地摘要时）

5.5 （可选）自动下载模型

6. 快速验证

7. 主界面GUI

8. 常见问题 (FAQ)

9. 参考资源

5.3 配置 `.env`（可选）