技术栈
libhsakmt
DeeplyMind
11 天前
libhsakmt
·
rocr-runtime
·
hsa event
ROCm rocr-libhsakmt分析系列5-1: Event 机制全景—从 Doorbell 到 Signal
event机制主线:一个进程通过 Thunk 层提交了多个 User Queue,某个时刻需要知道"哪个 Queue 干完了"。event机制共 4 篇文章,围绕这一场景逐层展开 ROCm / KFD 的 Event 机制。
DeeplyMind
1 个月前
libhsakmt
·
rocr-runtime
·
hsa event
Rocm rocr-libhsakmt Event 机制技术文章预告
主线故事:一个进程通过 Thunk 层提交了多个 User Queue,在某个时刻需要知道"哪个 Queue 完成了"——围绕这一场景,分 4 篇文章逐层展开 Event 的机制、实现和应用。预计5月陆续上线,请订阅关注。
DeeplyMind
3 个月前
rocm
·
rocr
·
libhsakmt
·
hsamemflags
ROCm rocr-libhsakmt分析系列4: HsaMemFlags分析
在前文中,我们分析了 GPU VM、aperture 以及 libhsakmt 实现的不同类型 apertures。本文将深入探讨更细粒度的地址空间管理单元:vm_object。至此,整个VM空间的层次关系呼之欲出,用图例展示一下。
DeeplyMind
8 个月前
linux
·
ai
·
amdgpu
·
rocm
·
rocr
·
libhsakmt
·
thunk
rocr专栏介绍
本专栏聚焦 AMD ROCm 生态的底层核心 ——rocr runtime 库,以 “从硬件交互到上层封装” 的技术链路为脉络,开展系统性、深粒度的实现分析,为开发者打通 “roc 底层机制 - 上层 C++ 调用 - 工程化实践” 的认知闭环。
我是有底线的