技术栈

libhsakmt

DeeplyMind
11 天前
libhsakmt·rocr-runtime·hsa event
ROCm rocr-libhsakmt分析系列5-1: Event 机制全景—从 Doorbell 到 Signalevent机制主线:一个进程通过 Thunk 层提交了多个 User Queue,某个时刻需要知道"哪个 Queue 干完了"。event机制共 4 篇文章,围绕这一场景逐层展开 ROCm / KFD 的 Event 机制。
DeeplyMind
1 个月前
libhsakmt·rocr-runtime·hsa event
Rocm rocr-libhsakmt Event 机制技术文章预告主线故事:一个进程通过 Thunk 层提交了多个 User Queue,在某个时刻需要知道"哪个 Queue 完成了"——围绕这一场景,分 4 篇文章逐层展开 Event 的机制、实现和应用。预计5月陆续上线,请订阅关注。
DeeplyMind
3 个月前
rocm·rocr·libhsakmt·hsamemflags
ROCm rocr-libhsakmt分析系列4: HsaMemFlags分析在前文中,我们分析了 GPU VM、aperture 以及 libhsakmt 实现的不同类型 apertures。本文将深入探讨更细粒度的地址空间管理单元:vm_object。至此,整个VM空间的层次关系呼之欲出,用图例展示一下。
DeeplyMind
8 个月前
linux·ai·amdgpu·rocm·rocr·libhsakmt·thunk
rocr专栏介绍本专栏聚焦 AMD ROCm 生态的底层核心 ——rocr runtime 库,以 “从硬件交互到上层封装” 的技术链路为脉络,开展系统性、深粒度的实现分析,为开发者打通 “roc 底层机制 - 上层 C++ 调用 - 工程化实践” 的认知闭环。
我是有底线的