【尝试】基于openai-whisper进行语音转文字windows版本

1、下载ffmpeg

https://ffmpeg.org/download.html#build-windows

解压缩,并放置到指定位置

在环境变量中进行配置

运行试看是否成功

2、确认电脑CUDA版本

下载Nvidia app

https://www.nvidia.cn/software/nvidia-app/

安装完成后,在终端输入:

bash 复制代码
nvidia-smi

3、创建虚拟环境

(1)创建whisper虚拟环境

bash 复制代码
conda create -n whisper python=3.10 -y

(2)激活whisper环境

(3)安装pytorch等依赖

上pytorch官网:https://pytorch.org/get-started/locally/

bash 复制代码
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

(4)安装whisper

bash 复制代码
pip install -U openai-whisper -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

安装完成后,创建一个whisper.py文件

python 复制代码
import whisper
model = whisper.load_model("base").to("cuda")  # 明确用 GPU
result = model.transcribe("your-audio-file.mp3")
print(result["text"])

运行,whisper.py文件

通过管理器,看GPU的运行情况

相关推荐
手揽回忆怎么睡2 天前
Java集成whisper.cpp
java·开发语言·whisper
YXWik63 天前
Linux安装Whisper(C++版)音频解析文本
linux·c++·whisper
普通网友4 天前
解决下载慢!Whisper 模型国内镜像源汇总与各版本快速获取
whisper
minhuan7 天前
大模型应用:语音转文本(ASR)实践:OpenAI Whisper精准转录解析.21
whisper·asr·多模态模型·语音转文本应用·语音大模型应用
DARLING Zero two♡13 天前
浏览器里跑 AI 语音转写?Whisper Web + cpolar让本地服务跑遍全网
前端·人工智能·whisper
johnny23315 天前
OpenAI Whisper:生态
whisper
不解不惑23 天前
OpenAI whisper 语音识别服务器搭建
服务器·whisper·语音识别
许泽宇的技术分享24 天前
用 OpenAI Whisper + pyannote.audio 打造“谁在说什么”的全栈语音理解系统
macos·whisper·xcode
这儿有一堆花1 个月前
使用 Whisper 转写语音的完整教学
人工智能·ai·whisper
数据饕餮2 个月前
Faster-Whisper命令和意图识别程序设计调优:上下文感知和领域词汇增强
whisper