MacOS下vllm运行Qwen3:8b模型

1 下载huggingface-cli命令

bash 复制代码
conda activate llm_env
conda install huggingface-cli
bash 复制代码
# 查看是否安装成功
hf version

输出:huggingface_hub version: 0.36.0

2 使用 huggingface-cli下载(可设置镜像)

bash 复制代码
# 设置镜像端点
export HF_ENDPOINT=https://hf-mirror.com
# 下载模型
hf download --resume-download Qwen/Qwen3-8B --local-dir ./Qwen3-8B

3 vllm运行Qwen3-8B

bash 复制代码
vllm serve ~/Qwen3-8B
相关推荐
GentleDevin32 分钟前
Mac 常用快捷键速查表
macos
GOU9240 分钟前
5101实验
网络·macos
柯儿的天空2 小时前
【OpenClaw 全面解析:从零到精通】第 005 篇:OpenClaw 在 macOS 上的安装与部署实战
人工智能·macos·自然语言处理·ai作画
冰封剑心5 小时前
VLLM部署
vllm
@大迁世界5 小时前
液态玻璃屏正在侵蚀你的电池
macos·ios·objective-c·cocoa
liangshanbo12155 小时前
[特殊字符] macOS 上的 zoxide:智能目录跳转终极指南
macos·策略模式
pop_xiaoli6 小时前
【iOS】类与对象底层
macos·ios·objective-c·cocoa·xcode
翱翔的苍鹰6 小时前
通过LangChain Agent模拟实现美团外卖下单场景
人工智能·深度学习·语言模型·自然语言处理·langchain·vllm
一招定胜负7 小时前
视频转写+LLM分析:课堂录音自动化处理实现
macos·ios·xcode
坚果派·白晓明8 小时前
在 macOS 中搭建鸿蒙 PC 三方库交叉编译开发环境
macos·华为·harmonyos