Whisper 从0安装教程 windows

这里写自定义目录标题

Whisper 从0安装教程 windows

因为需要把语音变成文字稿,问了做语言相关的朋友,决定使用whisper来做这个工作

官方网站:https://github.com/ggerganov/whisper.cpp

但是官网的教程一般小白很难从0开始。我一共折腾了两天,找了不少教程,走了两次弯路终于搞定了。

安装过程

安装python3.11

因为看到Anaconda官网上最新的版本是基于python3.11的,但是我自己电脑上的版本是python3.10,为了避免我这种不太会搞环境的人不装错,还是先卸载3.10,装上3.11

在这里下载3.11最新版本,之后双击安装。

安装完成之后能够在开始菜单看到新安装的python3.11.

安装Anaconda

ref:https://www.csrc.ac.cn/upload/file/20200721/1595289784836646.pdf

在Anaconda官网下载

下载后双击安装,记住Anaconda的安装路径

之后一路默认选项直到安装完毕。

在Anaconda里面安装whisper

打开anaconda prompt

要以管理员权限打开,否则会装不上whisper

conda create --name whisper python=3.11

安装 ffmpeg

conda activate whisper

pip install ffmpeg-python

ffmpeg -version

检查一下whisper是不是装好了

第一次运行whisper

去到语音文件在的路径下,运行whisper,然后发现GPU没用上。

检查GPU

在任务管理器中检查GPU型号,这里可以看到这个gpu是6BG的。

然后就是检查cuda版本。

这里cuda版本是12.2

但是pytorch官方只有cuda12.1的版本的对应版本。但是不要担心,直接用这个就行,cuda12.2 对cuda12.1向下兼容。(我试了把指令里的12.1,改成12.2,然后没找到这个版本的pytorch)

安装

Check 是否能用GPU

运行:

后面加 --model medium可以用中等的模型(需要GPU在5G及以上)

然后就可以了!

会生成对应的字幕文件和txt文件

好像还可以指定语言

whisper xxxxx.mp4 --model medium --language Chinese

一些弯路

中间我用到的教程有:

https://zhuanlan.zhihu.com/p/595691785

这个教程是装在系统中运行的,我一开始是想按照这个教程来装的,但是我后来在anaconda里面装了pytorch,感觉都在anaconda里面搞算了,毕竟装到系统里面还要改环境变量啥的很麻烦。

https://www.csrc.ac.cn/upload/file/20200721/1595289784836646.pdf

这个是anaconda里面pytorch的安装,写得非常详细,我基本就是照这个装的pytorch,但是我后来发现我把pytorch装在了base里面。。。。。第一次运行的whisper只能用cpu,用不了gpu

https://medium.com/@steel540/whisper-teach-article-90a68687b912

最后用了这个教程,在anaconda里面装好了运行。

一些走弯路的时候的截图:







相关推荐
梦帮科技1 小时前
Node.js配置生成器CLI工具开发实战
前端·人工智能·windows·前端框架·node.js·json
Lois_Luo1 小时前
关闭Win10强制所有应用以管理员身份运行
windows
luoyayun3612 小时前
实现Windows系统标题栏颜色跟随主题动态切换
windows·系统标题栏颜色·标题栏颜色
猫头虎3 小时前
如何解决 OpenClaw “Pairing required” 报错:两种官方解决方案详解
网络·windows·网络协议·macos·智能路由器·pip·scipy
lili-felicity3 小时前
CANN加速Whisper语音识别推理:流式处理与实时转录优化
人工智能·whisper·语音识别
呉師傅6 小时前
【使用技巧】Adobe Photoshop 2024调整缩放与布局125%后出现点菜单项漂移问题的简单处理
运维·服务器·windows·adobe·电脑·photoshop
梦帮科技8 小时前
OpenClaw 桥接调用 Windows MCP:打造你的 AI 桌面自动化助手
人工智能·windows·自动化
春日见9 小时前
如何创建一个PR
运维·开发语言·windows·git·docker·容器
C++ 老炮儿的技术栈9 小时前
VS2015 + Qt 实现图形化Hello World(详细步骤)
c语言·开发语言·c++·windows·qt
浩浩测试一下10 小时前
内网---> WriteOwner权限滥用
网络·汇编·windows·安全·microsoft·系统安全