AMD AI MAX +395迷你主机 架构1151安装 vllm部署大模型操作记录

第一步 操作系统ubuntu24.4.3

安装 rocm

版本7.1

网址https://rocm.docs.amd.com/projects/install-on-linux/en/latest/install/prerequisites.html

安装conda python3.12版本

安装pytorch等软件

目前pytorch 还没有兼容rocm7.1的版本

用rocm编译好的安装包(torch tensorflow apex jax jaxlib torchaudio torchvision triton)

https://repo.radeon.com/rocm/manylinux/rocm-rel-7.1.1/

安装下来后, 安装 pip install XXXX.wel

检查:pytorch 的版本 是否是:pytorch+rocm7.1

安装vllm前准备

git clone https://github.com/ROCm/flash-attention.git

cd flash-attention && git checkout v2.7.3-cktile && python setup.py install

pip install amdsmi --force-reinstall

pip install amdsmi==7.0.2

编译安装vllm

git clone -b v0.13.0 https://github.com/vllm-project/vllm.git

pip install --upgrade packaging --ignore-installed

pip install -r requirements/rocm.txt

export PYTORCH_ROCM_ARCH="gfx1151"

python3 setup.py install

下载模型

魔塔社区

https://modelscope.cn/models/openai-mirror/gpt-oss-120b

运行vllm

vllm serve / l/qwen3-32 --served-model-name qwen3-32 --dtype auto --max-model-len 32768 --host 0.0.0.0 --port 8000 --async-scheduling

相关推荐
不才不才不不才20 小时前
Spring AI 实战:聊天、提示词、记忆三件套
java·人工智能·spring·ai
汤姆yu20 小时前
Anthropic Claude Fable 5 深度解析
人工智能·ai·大模型·智能体·视频模型
zhayujie20 小时前
让 Agent 在对话中成长:自进化机制的五层实现
ai·大模型·agent·harness
dmmaxwell21 小时前
性价比高的AI外贸自动拓客哪个靠谱
ai
lllsure1 天前
【开源项目】Learn Claude Code
python·ai
甘露s1 天前
一文理解透MCP、Skill、Workflow的区别。
ai·ai编程
倔强的初学者1 天前
呼入智能客服提示词工程实战:从方法选型到框架融合的「最优解」
ai·prompt·智能客服·提示词工程·ai应用编程
像风一样自由20201 天前
17.推理框架横评:vLLM / TGI / TensorRT-LLM / SGLang 全面对比
人工智能·大模型·vllm·sglang
G_whang1 天前
Codex CLI 安装与国内模型配置指南
ai