Windows 上通过 WSL2 部署 Qwen3-ASR-0.6B - AI

因C盘空间不足,未完成验证。

以下是在 Windows 上通过 WSL2 部署 Qwen3-ASR-0.6B 的完整步骤:


第一步:启用 WSL2

管理员身份打开 PowerShell,运行:

复制代码
wsl --install

安装完成后重启电脑。重启后会自动弹出 Ubuntu 设置窗口,设置用户名和密码。

如果已有 WSL1,升级到 WSL2:

复制代码
wsl --set-default-version 2

第二步:安装 NVIDIA CUDA 驱动(有 GPU 的情况)

Windows 系统(不是 WSL)中安装最新 NVIDIA 驱动:

验证 GPU 是否识别(在 WSL Ubuntu 终端内):

复制代码
nvidia-smi

能看到 GPU 信息即成功。


第三步:在 WSL2 中安装基础依赖

打开 Ubuntu 终端,依次运行:

复制代码
# 更新系统
sudo apt update && sudo apt upgrade -y

# 安装基础工具
sudo apt install -y python3 python3-pip python3-venv ffmpeg git curl

第四步:创建 Python 虚拟环境

复制代码
# 创建虚拟环境
python3 -m venv ~/qwen-asr-env

# 激活虚拟环境
source ~/qwen-asr-env/bin/activate

# 后续每次使用都需要先激活

第五步:安装 PyTorch(带 CUDA 支持)

复制代码
# 有 NVIDIA GPU 的情况(CUDA 12.1)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

# 纯 CPU 的情况
pip install torch torchvision torchaudio

第六步:安装 qwen-asr 包

复制代码
pip install qwen-asr

第七步:下载模型

方式一:通过 Hugging Face(国际网络)

复制代码
pip install huggingface_hub
huggingface-cli download Qwen/Qwen3-ASR-0.6B --local-dir ~/Qwen3-ASR-0.6B

方式二:通过 ModelScope(国内网络推荐)

复制代码
pip install modelscope
modelscope download --model Qwen/Qwen3-ASR-0.6B --local_dir ~/Qwen3-ASR-0.6B

第八步:运行推理测试

准备一个音频文件(WAV 格式,16kHz 单声道效果最佳),然后运行:

复制代码
# 基本用法
qwen-asr --model ~/Qwen3-ASR-0.6B --audio your_audio.wav

# 指定语言(中文)
qwen-asr --model ~/Qwen3-ASR-0.6B --audio your_audio.wav --language Chinese

或者用 Python 调用:

复制代码
from qwen_asr import QwenASR

model = QwenASR("~/Qwen3-ASR-0.6B")
result = model.transcribe("your_audio.wav")
print(result)

第九步(可选):用 vLLM 启动服务接口

如果需要通过 HTTP API 调用:

复制代码
pip install vllm

vllm serve ~/Qwen3-ASR-0.6B \
  --host 0.0.0.0 \
  --port 8000 \
  --gpu-memory-utilization 0.8

服务启动后,在 Windows 浏览器或任何客户端访问 http://localhost:8000 即可。


常见问题

问题 解决方法
nvidia-smi 找不到 GPU 确认 Windows 侧 NVIDIA 驱动版本 ≥ 525
下载模型太慢 改用 ModelScope 或设置代理
内存不足 OOM 添加 --gpu-memory-utilization 0.7 降低显存占用
ffmpeg 找不到 运行 sudo apt install ffmpeg

如果在某一步遇到具体报错,把错误信息贴出来,我可以帮你定位解决。

相关推荐
To_OC1 天前
数据集划分不是随便切:手把手切分大众点评情感数据集
人工智能·llm·agent
冬奇Lab1 天前
每日一个开源项目(第142篇):android/skills - Google 官方 Android 开发 AI Skill 库
人工智能·开源·资讯
冬奇Lab1 天前
Skill 系列(06):Skill 工程化与治理——路由准确率 38%、压缩节省 76%
人工智能·开源·agent
IT_陈寒1 天前
Vue这个坑我跳了两次,原来问题出在这
前端·人工智能·后端
新新技术迷1 天前
Node给AI接口做SSE代理与鉴权
人工智能
redreamSo1 天前
大模型是不是到顶了?瓶颈到底在哪
人工智能·openai
Oo9201 天前
Tool Use 背后的技术逻辑
人工智能
姗姗来迟了1 天前
Vue3封装AI流式对话组件踩坑实录
人工智能
码上天下1 天前
用Pinia管理AI多会话状态
人工智能