rocm

DeeplyMind6 天前
linux·驱动开发·amdgpu·rocm·kfd
AMD KFD的BO设计分析系列6-1: VRAM BO的显存分配分析前文:AMD KFD的BO设计分析系列6: BO的物理地址部分-PM概述了BO物理空间的核心结构体间的关系,根据分配位置的不同,使用不同的管理器来实现物理空间的分配。本文介绍的AMD 的 VRAM 管理器(amdgpu_vram_mgr)负责为BO分配具体的设备内存(VRAM),重点分析TTM 框架下 ttm_resource 物理地址分配的代码实现,重点关注 VRAM 分配流程和物理地址的确定。
DeeplyMind21 天前
linux·ai·amdgpu·rocm·rocr·libhsakmt·thunk
rocr专栏介绍本专栏聚焦 AMD ROCm 生态的底层核心 ——rocr runtime 库,以 “从硬件交互到上层封装” 的技术链路为脉络,开展系统性、深粒度的实现分析,为开发者打通 “roc 底层机制 - 上层 C++ 调用 - 工程化实践” 的认知闭环。
DeeplyMind1 个月前
人工智能·机器学习·amdgpu·rocm·kfd
AMD KFD驱动技术分析16:SVM Aperture在 ROCm 的 libhsakmt 内存管理体系中,dGPU共享虚拟内存(SVM)管理是高性能异构计算的核心。为满足不同类型的内存一致性需求,hsakmt 针对 dGPU SVM 设计了两种 aperture(地址空间管理器):dgpu_aperture 和 dgpu_alt_aperture。这两者分别对应非一致性(non-coherent)和一致性(coherent)的 SVM 内存分配,底层实现和使用场景各有侧重。关于SVM的原理请参见:AMD KFD驱动技术分析11:SVM原理与核心概念。
Hi202402171 年前
gpu·cuda·amd·gpgpu·rocm
Rocprofiler测试Rocprofiler测试输出在 ROCm(Radeon Open Compute)平台中,Agent 通常指的是计算设备或处理单元,这些可以是 CPU 或 GPU。每个 Agent 可以执行计算任务并具有自己的计算资源,如计算核心、内存等。在 ROCm 的程序模型中,Agent 是负责执行特定任务的实体,当你使用 ROCm 进行并行计算时,任务通常会分配给不同的 Agent 来处理。Agent 是 ROCm 的异构计算环境中进行任务调度和管理的基本单元之一
Eloudy1 年前
c++·算法·rocm
roctracer 的应用示例mt.cpp编译:$ hipcc mt.cpp -o mt$ ./mt xxx不会产生文件;MatrixTranspose.cpp:
青禾子的夏1 年前
hip·rocm·异构计算
Rocm-Programming with HIP 内存分配hipHostMalloc 是 HIP API 中的一个函数,它用于在主机上分配特殊的内存,这种内存被称为 "pinned" 或 "page-locked" 内存。这种内存有以下特点和用途:
我是有底线的