1、下载ffmpeg
https://ffmpeg.org/download.html#build-windows


解压缩,并放置到指定位置

在环境变量中进行配置

运行试看是否成功

2、确认电脑CUDA版本
下载Nvidia app
https://www.nvidia.cn/software/nvidia-app/
安装完成后,在终端输入:
bash
nvidia-smi

3、创建虚拟环境
(1)创建whisper虚拟环境
bash
conda create -n whisper python=3.10 -y

(2)激活whisper环境

(3)安装pytorch等依赖
上pytorch官网:https://pytorch.org/get-started/locally/
bash
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
(4)安装whisper
bash
pip install -U openai-whisper -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple
安装完成后,创建一个whisper.py文件
python
import whisper
model = whisper.load_model("base").to("cuda") # 明确用 GPU
result = model.transcribe("your-audio-file.mp3")
print(result["text"])
运行,whisper.py文件

通过管理器,看GPU的运行情况