AMD AI MAX +395迷你主机 架构1151安装 vllm部署大模型操作记录

第一步 操作系统ubuntu24.4.3

安装 rocm

版本7.1

网址https://rocm.docs.amd.com/projects/install-on-linux/en/latest/install/prerequisites.html

安装conda python3.12版本

安装pytorch等软件

目前pytorch 还没有兼容rocm7.1的版本

用rocm编译好的安装包(torch tensorflow apex jax jaxlib torchaudio torchvision triton)

https://repo.radeon.com/rocm/manylinux/rocm-rel-7.1.1/

安装下来后, 安装 pip install XXXX.wel

检查:pytorch 的版本 是否是:pytorch+rocm7.1

安装vllm前准备

git clone https://github.com/ROCm/flash-attention.git

cd flash-attention && git checkout v2.7.3-cktile && python setup.py install

pip install amdsmi --force-reinstall

pip install amdsmi==7.0.2

编译安装vllm

git clone -b v0.13.0 https://github.com/vllm-project/vllm.git

pip install --upgrade packaging --ignore-installed

pip install -r requirements/rocm.txt

export PYTORCH_ROCM_ARCH="gfx1151"

python3 setup.py install

下载模型

魔塔社区

https://modelscope.cn/models/openai-mirror/gpt-oss-120b

运行vllm

vllm serve / l/qwen3-32 --served-model-name qwen3-32 --dtype auto --max-model-len 32768 --host 0.0.0.0 --port 8000 --async-scheduling

相关推荐
CoderJia程序员甲7 小时前
GitHub 热榜项目 - 日榜(2026-03-19)
人工智能·ai·大模型·github·ai教程
腾视科技TENSORTEC7 小时前
算力驱动智慧零售|腾视科技AI边缘算力盒子 —— 无人商超全场景解决方案重磅发布
人工智能·ai·零售·ainas·无人商超·ai边缘算力盒子·aibox
后端AI实验室8 小时前
我让AI模拟面试官考了我一个小时,然后我沉默了
java·ai
南宫乘风8 小时前
Qwen2.5-7B 指令(LoRA)微调完整实战指南
ai·语言模型·训练
少年强则国强8 小时前
openclaw接入飞书
ai
丁劲犇9 小时前
在Trae Solo模式下用Qt HttpServer和Concurrent升级MCP服务器绘制6G互联网覆盖区域
服务器·开发语言·qt·ai·6g·mcp·trae
_oP_i9 小时前
openclaw 支持Azure OpenAI 密钥和 endpoint https://xxx.openai.azure.com
ai
慵懒的猫mi9 小时前
deepin UOS AI 助手接入飞书(Feishu)配置指南
linux·人工智能·ai·gpt-3·飞书·文心一言·deepin
慵懒的猫mi9 小时前
deepin UOS AI 助手接入钉钉(DingTalk)配置指南
linux·数据库·人工智能·ai·钉钉·deepin
16Miku9 小时前
基于MetaBot将Claude Code接入飞书实战-Win版
ai·agent·claudecode·feishu·metabot