AMD AI MAX +395迷你主机 架构1151安装 vllm部署大模型操作记录

第一步 操作系统ubuntu24.4.3

安装 rocm

版本7.1

网址https://rocm.docs.amd.com/projects/install-on-linux/en/latest/install/prerequisites.html

安装conda python3.12版本

安装pytorch等软件

目前pytorch 还没有兼容rocm7.1的版本

用rocm编译好的安装包(torch tensorflow apex jax jaxlib torchaudio torchvision triton)

https://repo.radeon.com/rocm/manylinux/rocm-rel-7.1.1/

安装下来后, 安装 pip install XXXX.wel

检查:pytorch 的版本 是否是:pytorch+rocm7.1

安装vllm前准备

git clone https://github.com/ROCm/flash-attention.git

cd flash-attention && git checkout v2.7.3-cktile && python setup.py install

pip install amdsmi --force-reinstall

pip install amdsmi==7.0.2

编译安装vllm

git clone -b v0.13.0 https://github.com/vllm-project/vllm.git

pip install --upgrade packaging --ignore-installed

pip install -r requirements/rocm.txt

export PYTORCH_ROCM_ARCH="gfx1151"

python3 setup.py install

下载模型

魔塔社区

https://modelscope.cn/models/openai-mirror/gpt-oss-120b

运行vllm

vllm serve / l/qwen3-32 --served-model-name qwen3-32 --dtype auto --max-model-len 32768 --host 0.0.0.0 --port 8000 --async-scheduling

相关推荐
深念Y1 天前
仿B站项目 前端 3 首页 整体结构
前端·ai·vue·agent·bilibili·首页
imbackneverdie1 天前
研究生如何高效完成文献综述并提炼创新点?
人工智能·ai·语言模型·自然语言处理·aigc·ai写作
Lkygo1 天前
Embedding 和 Reranker 模型
人工智能·embedding·vllm·sglang
m0_726965981 天前
【闲聊】用coze和阿里云搭建agent区别
ai·agent
陈鋆1 天前
LightRAG应用一:[LightRAG WebUI]
ai
数白1 天前
Ai开发范式总结
ai·ai开发
不会用AI的老炮1 天前
【AI coding 智能体设计系列-05】上下文治理:清空压缩摘要与预算控制
人工智能·ai·ai编程
oscar9991 天前
Katalon StudioAssist:智能化测试助手
ai·katalon·studioassist
狮子座明仔1 天前
CiteFix: 通过后处理引用校正提升RAG系统准确率
人工智能·深度学习·ai·语言模型·自然语言处理