【尝试】基于openai-whisper进行语音转文字windows版本

1、下载ffmpeg

https://ffmpeg.org/download.html#build-windows

解压缩,并放置到指定位置

在环境变量中进行配置

运行试看是否成功

2、确认电脑CUDA版本

下载Nvidia app

https://www.nvidia.cn/software/nvidia-app/

安装完成后,在终端输入:

bash 复制代码
nvidia-smi

3、创建虚拟环境

(1)创建whisper虚拟环境

bash 复制代码
conda create -n whisper python=3.10 -y

(2)激活whisper环境

(3)安装pytorch等依赖

上pytorch官网:https://pytorch.org/get-started/locally/

bash 复制代码
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

(4)安装whisper

bash 复制代码
pip install -U openai-whisper -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

安装完成后,创建一个whisper.py文件

python 复制代码
import whisper
model = whisper.load_model("base").to("cuda")  # 明确用 GPU
result = model.transcribe("your-audio-file.mp3")
print(result["text"])

运行,whisper.py文件

通过管理器,看GPU的运行情况

相关推荐
J心流4 天前
89ms实时Whisper,显存还降48%
whisper
iDao技术魔方7 天前
whisper.cpp 深度解析:从边缘设备到实时语音识别
人工智能·whisper·语音识别
Gc9umsbL111 天前
从FLAC到WAV:whisper.cpp中的FFmpeg音频预处理全解析
ffmpeg·whisper·音视频
Bofu-14 天前
【音频测试】03-WPF 实现声道自动验证 + Whisper 语音识别录音检测
c#·whisper·wpf·音视频·音频测试·naudio 声道控制
JK Chen18 天前
faster_whisper,视频转文字,并生成字幕文件
python·whisper·音视频
工作log19 天前
10分钟搭建本地语音识别服务 (Whisper large-v3-turbo)
人工智能·whisper·语音识别
shao91851621 天前
第10章 Streaming(上):初级音频应用(1)——项目三:自建服务器的Mini-Omni实时语音聊天机器人
ffmpeg·whisper·asr·mini-omni·自建语音服务器
code_pgf25 天前
MNN Whisper 实时 ASR 工程实现
人工智能·whisper·mnn
独占的甜蜜1 个月前
从FLAC到WAV:whisper.cpp中的FFmpeg音频预处理全解析过程
ffmpeg·whisper·音视频
独占的甜蜜1 个月前
从FLAC到WAV:whisper.cpp中的FFmpeg音频预处理全解析
ffmpeg·whisper·音视频