Whisper 从0安装教程 windows

这里写自定义目录标题

[Whisper 从0安装教程 windows](#Whisper 从0安装教程 windows)
- 安装过程
- - 安装python3.11
  - 安装Anaconda
  - 在Anaconda里面安装whisper
  - [安装 ffmpeg](#安装 ffmpeg)
  - 第一次运行whisper
  - - 检查GPU
- 一些弯路

Whisper 从0安装教程 windows

因为需要把语音变成文字稿，问了做语言相关的朋友，决定使用whisper来做这个工作

官方网站：https://github.com/ggerganov/whisper.cpp

但是官网的教程一般小白很难从0开始。我一共折腾了两天，找了不少教程，走了两次弯路终于搞定了。

安装过程

安装python3.11

因为看到Anaconda官网上最新的版本是基于python3.11的，但是我自己电脑上的版本是python3.10，为了避免我这种不太会搞环境的人不装错，还是先卸载3.10，装上3.11

在这里下载3.11最新版本，之后双击安装。

安装完成之后能够在开始菜单看到新安装的python3.11.

安装Anaconda

ref：https://www.csrc.ac.cn/upload/file/20200721/1595289784836646.pdf

在Anaconda官网下载

下载后双击安装，记住Anaconda的安装路径

之后一路默认选项直到安装完毕。

在Anaconda里面安装whisper

打开anaconda prompt

要以管理员权限打开，否则会装不上whisper

conda create --name whisper python=3.11

安装 ffmpeg

conda activate whisper

pip install ffmpeg-python

ffmpeg -version

检查一下whisper是不是装好了

第一次运行whisper

去到语音文件在的路径下，运行whisper，然后发现GPU没用上。

检查GPU

在任务管理器中检查GPU型号，这里可以看到这个gpu是6BG的。

然后就是检查cuda版本。

这里cuda版本是12.2

但是pytorch官方只有cuda12.1的版本的对应版本。但是不要担心，直接用这个就行，cuda12.2 对cuda12.1向下兼容。（我试了把指令里的12.1，改成12.2，然后没找到这个版本的pytorch）

安装

Check 是否能用GPU

运行：

后面加 --model medium可以用中等的模型（需要GPU在5G及以上）

然后就可以了！

会生成对应的字幕文件和txt文件

好像还可以指定语言

whisper xxxxx.mp4 --model medium --language Chinese

一些弯路

中间我用到的教程有：

https://zhuanlan.zhihu.com/p/595691785

这个教程是装在系统中运行的，我一开始是想按照这个教程来装的，但是我后来在anaconda里面装了pytorch，感觉都在anaconda里面搞算了，毕竟装到系统里面还要改环境变量啥的很麻烦。

https://www.csrc.ac.cn/upload/file/20200721/1595289784836646.pdf

这个是anaconda里面pytorch的安装，写得非常详细，我基本就是照这个装的pytorch，但是我后来发现我把pytorch装在了base里面。。。。。第一次运行的whisper只能用cpu，用不了gpu

https://medium.com/@steel540/whisper-teach-article-90a68687b912

最后用了这个教程，在anaconda里面装好了运行。

一些走弯路的时候的截图：