因C盘空间不足,未完成验证。
以下是在 Windows 上通过 WSL2 部署 Qwen3-ASR-0.6B 的完整步骤:
第一步:启用 WSL2
以管理员身份打开 PowerShell,运行:
wsl --install
安装完成后重启电脑。重启后会自动弹出 Ubuntu 设置窗口,设置用户名和密码。
如果已有 WSL1,升级到 WSL2:
wsl --set-default-version 2
第二步:安装 NVIDIA CUDA 驱动(有 GPU 的情况)
在 Windows 系统(不是 WSL)中安装最新 NVIDIA 驱动:
- 前往 https://www.nvidia.com/Download/index.aspx 下载并安装
- WSL2 会自动识别 Windows 的 GPU,无需在 WSL 内单独装驱动
验证 GPU 是否识别(在 WSL Ubuntu 终端内):
nvidia-smi
能看到 GPU 信息即成功。
第三步:在 WSL2 中安装基础依赖
打开 Ubuntu 终端,依次运行:
# 更新系统
sudo apt update && sudo apt upgrade -y
# 安装基础工具
sudo apt install -y python3 python3-pip python3-venv ffmpeg git curl
第四步:创建 Python 虚拟环境
# 创建虚拟环境
python3 -m venv ~/qwen-asr-env
# 激活虚拟环境
source ~/qwen-asr-env/bin/activate
# 后续每次使用都需要先激活
第五步:安装 PyTorch(带 CUDA 支持)
# 有 NVIDIA GPU 的情况(CUDA 12.1)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
# 纯 CPU 的情况
pip install torch torchvision torchaudio
第六步:安装 qwen-asr 包
pip install qwen-asr
第七步:下载模型
方式一:通过 Hugging Face(国际网络)
pip install huggingface_hub
huggingface-cli download Qwen/Qwen3-ASR-0.6B --local-dir ~/Qwen3-ASR-0.6B
方式二:通过 ModelScope(国内网络推荐)
pip install modelscope
modelscope download --model Qwen/Qwen3-ASR-0.6B --local_dir ~/Qwen3-ASR-0.6B
第八步:运行推理测试
准备一个音频文件(WAV 格式,16kHz 单声道效果最佳),然后运行:
# 基本用法
qwen-asr --model ~/Qwen3-ASR-0.6B --audio your_audio.wav
# 指定语言(中文)
qwen-asr --model ~/Qwen3-ASR-0.6B --audio your_audio.wav --language Chinese
或者用 Python 调用:
from qwen_asr import QwenASR
model = QwenASR("~/Qwen3-ASR-0.6B")
result = model.transcribe("your_audio.wav")
print(result)
第九步(可选):用 vLLM 启动服务接口
如果需要通过 HTTP API 调用:
pip install vllm
vllm serve ~/Qwen3-ASR-0.6B \
--host 0.0.0.0 \
--port 8000 \
--gpu-memory-utilization 0.8
服务启动后,在 Windows 浏览器或任何客户端访问 http://localhost:8000 即可。
常见问题
| 问题 | 解决方法 |
|---|---|
nvidia-smi 找不到 GPU |
确认 Windows 侧 NVIDIA 驱动版本 ≥ 525 |
| 下载模型太慢 | 改用 ModelScope 或设置代理 |
| 内存不足 OOM | 添加 --gpu-memory-utilization 0.7 降低显存占用 |
ffmpeg 找不到 |
运行 sudo apt install ffmpeg |
如果在某一步遇到具体报错,把错误信息贴出来,我可以帮你定位解决。