MacOS下vllm运行Qwen3:8b模型

1 下载huggingface-cli命令

bash 复制代码
conda activate llm_env
conda install huggingface-cli
bash 复制代码
# 查看是否安装成功
hf version

输出:huggingface_hub version: 0.36.0

2 使用 huggingface-cli下载(可设置镜像)

bash 复制代码
# 设置镜像端点
export HF_ENDPOINT=https://hf-mirror.com
# 下载模型
hf download --resume-download Qwen/Qwen3-8B --local-dir ./Qwen3-8B

3 vllm运行Qwen3-8B

bash 复制代码
vllm serve ~/Qwen3-8B
相关推荐
00后程序员张10 小时前
Windows 下怎么生成 AppStoreInfo.plist?不依赖 Xcode 的方法
ide·macos·ios·小程序·uni-app·iphone·xcode
boldiy12 小时前
如何在MAC电脑中实现自动切换windows快捷键
windows·macos
木雷坞13 小时前
vLLM 服务启动慢排查:NAS 模型目录、Docker 镜像和 GPU Runtime
docker·容器·vllm
张3蜂13 小时前
Flutter macOS 安装文档
flutter·macos
Nan-h113 小时前
Mac 剪贴板工具选型:先看工作流,再看 Maccy、Raycast、Paste 和 uPaste
macos·贴图
Rabbit_QL13 小时前
【find的用法】macOS/Linux 下高效查找文件
linux·macos
大熊猫侯佩1 天前
升级到 macOS26.5 后看视频会自动息屏的解决
macos·操作系统
磊 子2 天前
C++ IO 流
macos·objective-c·cocoa
real_haha2 天前
我做了一个仅有 1.3 MB 的 macOS 原生 AI 助手:AskNow
人工智能·macos