【尝试】基于openai-whisper进行语音转文字windows版本

1、下载ffmpeg

https://ffmpeg.org/download.html#build-windows

解压缩,并放置到指定位置

在环境变量中进行配置

运行试看是否成功

2、确认电脑CUDA版本

下载Nvidia app

https://www.nvidia.cn/software/nvidia-app/

安装完成后,在终端输入:

bash 复制代码
nvidia-smi

3、创建虚拟环境

(1)创建whisper虚拟环境

bash 复制代码
conda create -n whisper python=3.10 -y

(2)激活whisper环境

(3)安装pytorch等依赖

上pytorch官网:https://pytorch.org/get-started/locally/

bash 复制代码
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

(4)安装whisper

bash 复制代码
pip install -U openai-whisper -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

安装完成后,创建一个whisper.py文件

python 复制代码
import whisper
model = whisper.load_model("base").to("cuda")  # 明确用 GPU
result = model.transcribe("your-audio-file.mp3")
print(result["text"])

运行,whisper.py文件

通过管理器,看GPU的运行情况

相关推荐
心动啊1212 天前
了解语音识别模型Whisper
人工智能·whisper·语音识别
半壶清水2 天前
【开源免费】使用 Python + Whisper + PyDub 自动切割长音频文件
开发语言·python·语言模型·开源·whisper
熊猫钓鱼>_>12 天前
基于Trae/Whisper/FFmpeg与Knowledge Graph MCP技术开发语音生成会议纪要智能应用
开发语言·人工智能·python·深度学习·ffmpeg·whisper·trae
未来之窗软件服务13 天前
幽冥大陆(七十一) Whisper-ASR网页对接语音识别—东方仙盟练气期
javascript·whisper·语音识别·仙盟创梦ide·东方仙盟
未来之窗软件服务14 天前
幽冥大陆(六十九) Whisper-CLI —东方仙盟练气期
人工智能·whisper·语音识别·仙盟创梦ide·东方仙盟
红苕稀饭66615 天前
Whisper-Flamingo论文阅读
论文阅读·whisper
CrankZ15 天前
幕译 1.7--本地字幕生成与翻译--支持macOS,Windows
macos·whisper
未来之窗软件服务19 天前
幽冥大陆(五十七)ASR whisper-cli命令行使用 C语言—东方仙盟筑基期
c语言·开发语言·whisper·仙盟创梦ide·东方仙盟·东方仙盟自动化·东方仙盟商业开发
手揽回忆怎么睡24 天前
Java集成whisper.cpp
java·开发语言·whisper
YXWik624 天前
Linux安装Whisper(C++版)音频解析文本
linux·c++·whisper