技术栈
rocm
Hi20240217
2 个月前
gpu
·
cuda
·
amd
·
gpgpu
·
rocm
Rocprofiler测试
Rocprofiler测试输出在 ROCm(Radeon Open Compute)平台中,Agent 通常指的是计算设备或处理单元,这些可以是 CPU 或 GPU。每个 Agent 可以执行计算任务并具有自己的计算资源,如计算核心、内存等。在 ROCm 的程序模型中,Agent 是负责执行特定任务的实体,当你使用 ROCm 进行并行计算时,任务通常会分配给不同的 Agent 来处理。Agent 是 ROCm 的异构计算环境中进行任务调度和管理的基本单元之一
Eloudy
2 个月前
c++
·
算法
·
rocm
roctracer 的应用示例
mt.cpp编译:$ hipcc mt.cpp -o mt$ ./mt xxx不会产生文件;MatrixTranspose.cpp:
青禾子的夏
2 个月前
hip
·
rocm
·
异构计算
Rocm-Programming with HIP 内存分配
hipHostMalloc 是 HIP API 中的一个函数,它用于在主机上分配特殊的内存,这种内存被称为 "pinned" 或 "page-locked" 内存。这种内存有以下特点和用途: