国产GPU与ROCm架构的关系 国产GPU架构总结 ROCm 7.1 在 PyTorch 官网上被划掉(横线)直接支持

国产GPU与ROCm架构的关系,以及它们是否采用了AMD的授权。

这是一个非常好的问题。让我根据搜索结果为您详细解答:

国产GPU与ROCm的关系:并非都是ROCm架构,只有一家是AMD授权

1. 海光信息(Hygon)------ 唯一获得AMD ROCm授权

海光信息是国内唯一一家真正基于AMD架构授权的GPU厂商

  • 通过合资子公司获得AMD Zen架构和GPU架构授权
  • 其DCU(深算)系列协处理器原生兼容ROCm生态
  • 被称为"类CUDA"生态,CUDA用户可以低成本迁移到ROCm平台
  • 这是正规的商业授权关系,不是简单的兼容或模仿

海光的优势在于软件迁移门槛最低,因为直接基于AMD的ROCm生态开发。


2. 其他国产GPU厂商 ------ 自研架构,非ROCm授权

其他主要国产GPU厂商都没有使用ROCm架构或获得AMD授权,而是采取不同策略:

厂商 架构名称 与ROCm/CUDA的关系 技术路线
摩尔线程 MUSA 自主研发,与CUDA无依赖关系 自研全功能GPU架构,通过MUSIFY工具兼容CUDA源代码
壁仞科技 BIRENSUPA 自主研发,从指令集到编译器全自研 训推一体架构,兼容CUDA API
沐曦集成电路 MXMACA 自主研发,兼容CUDA生态 强调集群交付和软件栈兼容
天数智芯 自研架构 自研GPGPU架构 天垓/智铠分训练推理产品线
景嘉微 JM系列 完全自主研发 军用向民用拓展,非AI训练重点
华为昇腾 CANN 完全自主研发 开源CANN生态,与CUDA/ROCm无关
寒武纪 自研架构 自主研发 AI专用芯片,非GPU路线
芯动科技 自研架构 自主研发 多产品线布局

3. "兼容CUDA" ≠ "使用ROCm架构"

很多国产GPU宣称"兼容CUDA",但这与使用ROCm架构是完全不同的概念:

ROCm路线(仅海光)

  • 底层基于AMD GPU架构
  • 使用AMD的HIP(类CUDA语法)进行编程
  • 直接调用ROCm函数库和编译器

自研架构 + CUDA兼容(摩尔线程、壁仞、沐曦等)

  • 自主研发指令集架构
  • 开发API转换层,将CUDA代码翻译为自己的指令
  • 摩尔线程的MUSA架构明确声明:"与CUDA无任何依赖关系"
  • 壁仞科技强调:"从指令集到算子库再到编译器层面,均是自主研发"

华为昇腾路线

  • 完全独立的CANN生态
  • 与CUDA/ROCm无关
  • 2025年8月宣布全面开源

4. 为什么大家都要兼容CUDA,而不是ROCm?

尽管ROCm是开源的,但国产GPU厂商选择兼容CUDA而非ROCm,原因在于:

  1. CUDA是行业标准:几乎所有AI框架(PyTorch、TensorFlow)都优先支持CUDA
  2. 开发者惯性:全球300万+ CUDA开发者,迁移成本极高
  3. ROCm生态成熟度不足:即使AMD自己推ROCm,市场占有率仍远不及CUDA

5. 关于AMD授权的法律风险

海光信息虽然获得了AMD授权,但也面临风险:

  • 2019年被列入美国实体清单后,AMD停止了新的技术交流
  • 2022年受到长臂管辖,先进芯片海外流片受阻

其他厂商选择自研架构,部分原因也是为了规避知识产权风险


总结

国产GPU并非都是ROCm架构

  • 只有海光信息是通过正规商业授权使用AMD/ROCm架构
  • 摩尔线程、壁仞、沐曦、天数智芯 等都是完全自主研发架构,通过软件层兼容CUDA,与ROCm无关
  • 华为昇腾、寒武纪等走完全独立的技术路线

因此,"国产GPU都是ROCm架构"是一个误解。实际上,绝大多数国产GPU厂商都在努力构建自主可控的软件生态,而非依赖AMD的ROCm授权。

ROCm 7.1 在 PyTorch 官网上被划掉(横线)** 的原因:

核心原因:版本支持状态的变化

ROCm 7.1 被划掉通常表示该版本已被弃用(deprecated)或不再推荐使用,可能有以下几种情况:

1. PyTorch 2.10 发布后,ROCm 7.1 支持已整合到稳定版

根据搜索结果,PyTorch 2.10(2026年1月21日发布)已经原生支持 ROCm 7.1。在此之前(PyTorch 2.9 及更早版本),ROCm 7.1 支持需要通过 nightly 版本或自行编译获得。

当 PyTorch 稳定版正式支持某个 ROCm 版本后,官网上可能会将之前标记为"实验性"或"预览版"的 ROCm 7.1 选项划掉,引导用户使用更新的 PyTorch 稳定版。

2. ROCm 版本迭代,推荐使用更新版本

ROCm 版本更新很快(目前已经有 ROCm 7.1.1 等更新版本)。被划掉的 ROCm 7.1 可能表示:

  • 该版本已被 ROCm 7.1.1 或更高版本取代
  • 存在已知问题或安全漏洞,不再推荐安装

3. 平台/构建类型限制

在 PyTorch 安装矩阵中,ROCm 7.1 的可用性取决于你选择的:

  • Stable(稳定版) vs Nightly( nightly 版):某些 ROCm 版本可能只在 nightly 中提供
  • 操作系统:ROCm 7.1 对 Windows 的支持是近期才加入的,早期可能只在 Linux 上可用

当前推荐做法

如果你需要使用 ROCm 7.1:

  1. 使用 PyTorch 2.10+ 稳定版(推荐)

    bash 复制代码
    pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm7.1
  2. 或者使用 Nightly 版本(如果需要最新功能):

    bash 复制代码
    pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/rocm7.1
  3. 使用官方 Docker 镜像(最稳定):

    bash 复制代码
    docker pull rocm/pytorch:latest

总结

横线划掉 ROCm 7.1 是 PyTorch 官网的一种视觉提示,表示:

  • 该版本已过时,或有更好的替代方案
  • 建议升级到 PyTorch 2.10+ 以获得原生 ROCm 7.1 支持
  • 或选择更新的 ROCm 版本(如 7.1.1)

如果你看到 ROCm 7.1 被划掉,通常意味着你应该选择 PyTorch 2.10(Stable)+ ROCm 7.1 的组合,而不是旧版的 nightly 构建。

相关推荐
xiaolingting1 小时前
Gateway 网关流控与限流架构指南
spring cloud·架构·gateway·sentinel
咚咚王者1 小时前
人工智能之语言领域 自然语言处理 第十一章 注意力机制
人工智能·自然语言处理
AI科技星1 小时前
基于v≡c空间光速螺旋量子几何归一化统一场论第一性原理的时间势差本源理论
人工智能·线性代数·算法·机器学习·平面
王的宝库1 小时前
AI 学习笔记:AI学习模式 Transformer、RAG、Skill、MCP
人工智能·笔记·学习
范桂飓1 小时前
OpenClaw 架构解析
人工智能·架构
小圣贤君2 小时前
在 Electron 里造一个「搜书 + 下载」:从 so-novel 到 51mazi 的爬虫实践
前端·人工智能·爬虫·electron·ai写作·小说下载·网文下载
AC赳赳老秦2 小时前
智能协同新纪元:DeepSeek驱动的跨岗位、跨工具多智能体实操体系展望(2026)
大数据·运维·人工智能·深度学习·机器学习·ai-native·deepseek
艾莉丝努力练剑2 小时前
【MYSQL】MYSQL学习的一大重点:MYSQL数据类型
android·linux·数据库·人工智能·学习·mysql·网络安全
fanxianshi2 小时前
2026 年 3 月行业动态与开源生态全景报告
人工智能·深度学习·神经网络·机器学习·计算机视觉·开源·语音识别