rocm

DeeplyMind1 天前
人工智能·机器学习·amdgpu·rocm·kfd
AMD KFD驱动技术分析16:SVM Aperture在 ROCm 的 libhsakmt 内存管理体系中,dGPU共享虚拟内存(SVM)管理是高性能异构计算的核心。为满足不同类型的内存一致性需求,hsakmt 针对 dGPU SVM 设计了两种 aperture(地址空间管理器):dgpu_aperture 和 dgpu_alt_aperture。这两者分别对应非一致性(non-coherent)和一致性(coherent)的 SVM 内存分配,底层实现和使用场景各有侧重。关于SVM的原理请参见:AMD KFD驱动技术分析11:SVM原理与核心概念。
Hi202402171 年前
gpu·cuda·amd·gpgpu·rocm
Rocprofiler测试Rocprofiler测试输出在 ROCm(Radeon Open Compute)平台中,Agent 通常指的是计算设备或处理单元,这些可以是 CPU 或 GPU。每个 Agent 可以执行计算任务并具有自己的计算资源,如计算核心、内存等。在 ROCm 的程序模型中,Agent 是负责执行特定任务的实体,当你使用 ROCm 进行并行计算时,任务通常会分配给不同的 Agent 来处理。Agent 是 ROCm 的异构计算环境中进行任务调度和管理的基本单元之一
Eloudy1 年前
c++·算法·rocm
roctracer 的应用示例mt.cpp编译:$ hipcc mt.cpp -o mt$ ./mt xxx不会产生文件;MatrixTranspose.cpp:
青禾子的夏1 年前
hip·rocm·异构计算
Rocm-Programming with HIP 内存分配hipHostMalloc 是 HIP API 中的一个函数,它用于在主机上分配特殊的内存,这种内存被称为 "pinned" 或 "page-locked" 内存。这种内存有以下特点和用途:
我是有底线的