MacOS下vllm运行Qwen3:8b模型

xiliuhu2026-01-24 8:15

1 下载huggingface-cli命令

bash 复制代码

conda activate llm_env
conda install huggingface-cli

bash 复制代码

# 查看是否安装成功
hf version

输出：huggingface_hub version: 0.36.0

2 使用 huggingface-cli下载（可设置镜像）

bash 复制代码

# 设置镜像端点
export HF_ENDPOINT=https://hf-mirror.com
# 下载模型
hf download --resume-download Qwen/Qwen3-8B --local-dir ./Qwen3-8B

3 vllm运行Qwen3-8B

bash 复制代码

vllm serve ~/Qwen3-8B

上一篇：【国内电子数据取证厂商龙信科技】Charles的简单介绍及基本配置

下一篇：Spring Boot核心特性与配置全解析

热门推荐

01GitHub 镜像站点 02Codex 接入 DeepSeek API 完整配置文档 03装上就回不去了：CodeGraph 让 AI 编程效率飙升 92%，它到底做了什么？04CC-Switch & Claude 基于 Linux 服务器安装使用指南 05【踩坑记录 | 第一篇】微软商店无法使用时，如何手动安装 OpenAI Codex？附`.msix`文件系统错误解决方法 06裂开！ChatGPT 居然开始要手机号验证，附详细解决方法 07几个好用的ip纯净度检测网站 08【AI】2026 年具身智能模型和世界模型总结 09用了半年 OpenRouter，我换到了 Ofox.ai — 两个 AI API 聚合平台的真实对比 10codex app每次打开重连5次Reconnecting问题解决