AMD AI MAX +395迷你主机 架构1151安装 vllm部署大模型操作记录

第一步 操作系统ubuntu24.4.3

安装 rocm

版本7.1

网址https://rocm.docs.amd.com/projects/install-on-linux/en/latest/install/prerequisites.html

安装conda python3.12版本

安装pytorch等软件

目前pytorch 还没有兼容rocm7.1的版本

用rocm编译好的安装包(torch tensorflow apex jax jaxlib torchaudio torchvision triton)

https://repo.radeon.com/rocm/manylinux/rocm-rel-7.1.1/

安装下来后, 安装 pip install XXXX.wel

检查:pytorch 的版本 是否是:pytorch+rocm7.1

安装vllm前准备

git clone https://github.com/ROCm/flash-attention.git

cd flash-attention && git checkout v2.7.3-cktile && python setup.py install

pip install amdsmi --force-reinstall

pip install amdsmi==7.0.2

编译安装vllm

git clone -b v0.13.0 https://github.com/vllm-project/vllm.git

pip install --upgrade packaging --ignore-installed

pip install -r requirements/rocm.txt

export PYTORCH_ROCM_ARCH="gfx1151"

python3 setup.py install

下载模型

魔塔社区

https://modelscope.cn/models/openai-mirror/gpt-oss-120b

运行vllm

vllm serve / l/qwen3-32 --served-model-name qwen3-32 --dtype auto --max-model-len 32768 --host 0.0.0.0 --port 8000 --async-scheduling

相关推荐
桔子雨14 小时前
【PicoBox】基于 C# + PicoServer,面向 AI 生成网页的托管工具
ai·picoserver·轻量web框架
薛定谔的猫36914 小时前
LLM Agents: 从大语言模型到自主智能体的演进与架构解析
ai·llm·agent·machine learning·architecture
笨蛋©15 小时前
[实战] 制造业 ISO 9001 认证中的数字化质量控制:从检验计划到自动化闭环
ai·cad·质量管理·制造业·图纸识别
AwesomeCPA16 小时前
Claude Code 实战(2):构建工业级 AI 并行开发流水线
ai
笨蛋©17 小时前
[实战] 制造业数字化:CAD图纸气泡图自动化标注与检验计划生成指南
ai·数字化·cad·质量管理·制造业
熊猫钓鱼>_>19 小时前
当“虾”遇上“马”:QClaw 融合 Hermes 背后的智能体进化论
人工智能·ai·腾讯云·agent·openclaw·qclaw·hermes
深念Y19 小时前
Denuvo加密被全面攻破?聊聊D加密原理和这次的破解事件
人工智能·游戏·ai·逆向·虚拟机·虚拟·d加密
Agent产品评测局19 小时前
生产排期与MES/ERP系统打通,实操方法详解:2026企业级智能体与超自动化集成实战指南
运维·人工智能·ai·chatgpt·自动化
我是发哥哈20 小时前
主流AI框架生产环境性能对比:5大关键维度深度评测
大数据·人工智能·学习·机器学习·ai·chatgpt·ai-native
belldeep20 小时前
基于深度学习的中医药系统 与《本草纲目》结合应用
人工智能·深度学习·ai·中医药