MacOS下vllm运行Qwen3:8b模型

1 下载huggingface-cli命令

bash 复制代码
conda activate llm_env
conda install huggingface-cli
bash 复制代码
# 查看是否安装成功
hf version

输出:huggingface_hub version: 0.36.0

2 使用 huggingface-cli下载(可设置镜像)

bash 复制代码
# 设置镜像端点
export HF_ENDPOINT=https://hf-mirror.com
# 下载模型
hf download --resume-download Qwen/Qwen3-8B --local-dir ./Qwen3-8B

3 vllm运行Qwen3-8B

bash 复制代码
vllm serve ~/Qwen3-8B
相关推荐
總鑽風6 小时前
搭建Spring Boot + ELK日志平台,实现可视化日志监控
spring boot·elk·macos
执笔论英雄9 小时前
【vllm】PD分离
vllm
CS创新实验室12 小时前
《计算机网络》深入学:IP地址 VS. MAC地址
tcp/ip·计算机网络·macos
是孑然呀12 小时前
mac m4mini安装软件
macos
简单点了12 小时前
mac安装Java环境
java·macos
涔溪12 小时前
腾讯 WorkBuddy 超详细卸载清理文档(适用于 Windows 1011 + macOS 全版本,彻底卸载、不留残留)
windows·macos·ai·workbuddy
简单点了13 小时前
mac安装idea
java·macos·intellij-idea
谢白羽13 小时前
多集群/分布式 LLM 推理方案全景:2026 年选型指南
分布式·vllm·sglang·llm-d
涔溪14 小时前
腾讯 WorkBuddy 超详细安装教程(Windows+macOS 全步骤)
windows·macos·workbuddy
一个人旅程~14 小时前
如何解决跨平台(macos/win)与跨app软件工具(Pages、Keynote/office等)的字体错乱与排版混乱问题?(完整版)
linux·windows·经验分享·macos·电脑