【尝试】基于openai-whisper进行语音转文字windows版本

Micheal_Dad2025-07-17 11:16

1、下载ffmpeg

解压缩，并放置到指定位置

在环境变量中进行配置

运行试看是否成功

2、确认电脑CUDA版本

下载Nvidia app

安装完成后，在终端输入：

bash 复制代码

nvidia-smi

3、创建虚拟环境

（1）创建whisper虚拟环境

bash 复制代码

conda create -n whisper python=3.10 -y

（2）激活whisper环境

（3）安装pytorch等依赖

bash 复制代码

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

（4）安装whisper

bash 复制代码

pip install -U openai-whisper -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

安装完成后，创建一个whisper.py文件

python 复制代码

import whisper
model = whisper.load_model("base").to("cuda")  # 明确用 GPU
result = model.transcribe("your-audio-file.mp3")
print(result["text"])

运行，whisper.py文件

通过管理器，看GPU的运行情况