Whisper 从0安装教程 windows

这里写自定义目录标题

Whisper 从0安装教程 windows

因为需要把语音变成文字稿,问了做语言相关的朋友,决定使用whisper来做这个工作

官方网站:https://github.com/ggerganov/whisper.cpp

但是官网的教程一般小白很难从0开始。我一共折腾了两天,找了不少教程,走了两次弯路终于搞定了。

安装过程

安装python3.11

因为看到Anaconda官网上最新的版本是基于python3.11的,但是我自己电脑上的版本是python3.10,为了避免我这种不太会搞环境的人不装错,还是先卸载3.10,装上3.11

在这里下载3.11最新版本,之后双击安装。

安装完成之后能够在开始菜单看到新安装的python3.11.

安装Anaconda

ref:https://www.csrc.ac.cn/upload/file/20200721/1595289784836646.pdf

在Anaconda官网下载

下载后双击安装,记住Anaconda的安装路径

之后一路默认选项直到安装完毕。

在Anaconda里面安装whisper

打开anaconda prompt

要以管理员权限打开,否则会装不上whisper

conda create --name whisper python=3.11

安装 ffmpeg

conda activate whisper

pip install ffmpeg-python

ffmpeg -version

检查一下whisper是不是装好了

第一次运行whisper

去到语音文件在的路径下,运行whisper,然后发现GPU没用上。

检查GPU

在任务管理器中检查GPU型号,这里可以看到这个gpu是6BG的。

然后就是检查cuda版本。

这里cuda版本是12.2

但是pytorch官方只有cuda12.1的版本的对应版本。但是不要担心,直接用这个就行,cuda12.2 对cuda12.1向下兼容。(我试了把指令里的12.1,改成12.2,然后没找到这个版本的pytorch)

安装

Check 是否能用GPU

运行:

后面加 --model medium可以用中等的模型(需要GPU在5G及以上)

然后就可以了!

会生成对应的字幕文件和txt文件

好像还可以指定语言

whisper xxxxx.mp4 --model medium --language Chinese

一些弯路

中间我用到的教程有:

https://zhuanlan.zhihu.com/p/595691785

这个教程是装在系统中运行的,我一开始是想按照这个教程来装的,但是我后来在anaconda里面装了pytorch,感觉都在anaconda里面搞算了,毕竟装到系统里面还要改环境变量啥的很麻烦。

https://www.csrc.ac.cn/upload/file/20200721/1595289784836646.pdf

这个是anaconda里面pytorch的安装,写得非常详细,我基本就是照这个装的pytorch,但是我后来发现我把pytorch装在了base里面。。。。。第一次运行的whisper只能用cpu,用不了gpu

https://medium.com/@steel540/whisper-teach-article-90a68687b912

最后用了这个教程,在anaconda里面装好了运行。

一些走弯路的时候的截图:







相关推荐
winlife_7 小时前
全程用 AI 做一款商业级手游 · EP10 道具系统:让三个按钮真正改变棋盘
windows·算法·unity·ai编程·游戏开发·mcp·玩法系统
小二·7 小时前
Prompt Engineering 实战
网络·windows·prompt
fastjson_7 小时前
使用 ventoy 安装WinToGo
windows
Chase_______8 小时前
【Java杂项】Arrays.asList、List.of 和 new ArrayList:集合可变性避坑
java·windows·list
CodeStats8 小时前
从 CPU 指令执行到权限管控:对比三大操作系统,梳理编程语言演进,解读 HTML/CSS/JS 浏览器解析的共通底层逻辑
java·linux·windows
ziyitty8 小时前
解决Windows下Bash调用Python输出中文乱码的问题
windows·python·bash
charlie1145141919 小时前
通用GUI编程技术——图形渲染实战(四十九)——完全自绘控件架构:状态机与动画
c++·windows·架构·图形渲染
Java.熵减码农10 小时前
Windows 下 Node.js 安装与配置完全指南
windows·node.js
love530love17 小时前
LiveTalking 数字人项目 Windows 部署完全指南(EPGF 架构)
人工智能·windows·python·架构·livetalking·epgf
CryptoPP18 小时前
快速对接东京证券交易所API数据:实战指南与代码示例
开发语言·人工智能·windows·python·信息可视化·区块链