MacOS下vllm运行Qwen3:8b模型

1 下载huggingface-cli命令

bash 复制代码
conda activate llm_env
conda install huggingface-cli
bash 复制代码
# 查看是否安装成功
hf version

输出:huggingface_hub version: 0.36.0

2 使用 huggingface-cli下载(可设置镜像)

bash 复制代码
# 设置镜像端点
export HF_ENDPOINT=https://hf-mirror.com
# 下载模型
hf download --resume-download Qwen/Qwen3-8B --local-dir ./Qwen3-8B

3 vllm运行Qwen3-8B

bash 复制代码
vllm serve ~/Qwen3-8B
相关推荐
猫头虎19 小时前
如何解决 OpenClaw “Pairing required” 报错:两种官方解决方案详解
网络·windows·网络协议·macos·智能路由器·pip·scipy
bloglin9999919 小时前
Qwen3-32B大模型vLLM启动建议
vllm
洋洋代码2 天前
本地vLLM部署大模型使用Langchain4J调用问题(非流式)
vllm·langchain4j·qwen3
皮卡车厘子2 天前
Mac 挂载目录
macos
海棠AI实验室2 天前
RunPod Serverless + vLLM:大语言模型部署与配置指南(实战版)
部署·vllm·runpod
良逍Ai出海2 天前
在 Windows & macOS 上安装 Claude Code,并使用第三方 Key 的完整教程
windows·macos
热爱生活的五柒2 天前
linux/mac/wsl如何使用claude code,并配置免费的硅基流动API?(官方的需要付费订阅)
linux·运维·macos
胖胖大王叫我来巡山2 天前
mac本地安装DataEase桌面版
macos
奋斗者1号2 天前
OpenClaw 部署方式对比:云端、WSL、Mac 本机、Ubuntu 虚拟机(2026年2月最新主流实践)
linux·ubuntu·macos
玉梅小洋2 天前
Android SDK 安装指南(MacOS 和 Windows)
android·windows·macos·sdk