kfd

DeeplyMind1 天前
kfd·amdgpu svm
附录A:AMDGPU SVM 属性类型kfd_ioctl_svm_attr_type 枚举定义了 SVM(Shared Virtual Memory)的所有属性类型,用于控制 GPU 对共享虚拟内存的访问行为、数据位置偏好、以及一致性模式。
DeeplyMind2 天前
svm·amdgpu·kfd
04 - SVM核心数据结构详解难度: 🟡 进阶 预计学习时间: 1.5-2小时 前置知识: C语言结构体、链表、红黑树基础理解数据结构是掌握SVM实现的关键。AMDGPU SVM的核心数据结构复杂,承载了虚拟内存范围管理、页面状态跟踪、GPU映射信息等关键功能。本章将深入剖析四个核心数据结构,理解它们的设计意图和使用方式。
DeeplyMind3 天前
hmm·rocm·kfd·共享虚拟内存·amdgpu svm
02 - SVM相关的Linux内核基础难度: 🟢🟡 入门到进阶 预计学习时间: 1-2小时 前置知识: 操作系统基础、了解指针和内存概念
DeeplyMind5 天前
svm·amdgpu·rocm·kfd
01 - 什么是SVM难度: 🟢 入门级 预计学习时间: 30-45分钟 前置知识: 基本的CPU/GPU概念,了解虚拟内存
DeeplyMind9 天前
svm·rocm·kfd
AMD ROCm-SVM技术的实现与应用深度分析目录本系列文档旨在帮助新手系统学习AMDGPU中的Shared Virtual Memory (SVM)技术。SVM作为异构计算ROCm和CUDA编程的核心支撑技术,在人工智能时代有着举足轻重的地位,已成为驱动开发者们必备的一项技能。 本专栏为2026年02月专栏,二月周一到周五每天发布一篇(节假日除外)。敬请订阅关注,以便及时收到发布通知。
DeeplyMind25 天前
amdgpu·tlb·kfd
AMD KFD的BO设计分析系列8-7:TLB管理与刷新TLB(Translation Lookaside Buffer)是GPU虚拟内存系统的性能关键,缓存虚拟地址到物理地址的映射关系。当页表更新后,必须刷新TLB以保证地址转换的正确性。
DeeplyMind1 个月前
驱动开发·amdgpu·kfd·gart
AMD KFD的BO设计分析系列7-2:GPU GART 实现深度解析--绑定机制与性能优化GART的基本原理请查看:AMD KFD的BO设计分析系列7-1:GPU GART 实现深度解析–基础架构与工作原理。
DeeplyMind2 个月前
linux·amdgpu·rocm·kfd·rocr
AMD rocr-libhsakmt分析系列3-1: Apertures前文已经给出了aperture的定义。在 AMD GPU 的 HSA运行时中,Aperture(孔径)是一个核心概念,用于管理和组织不同类型的内存区域。libhsakmt 库通过精心设计的 aperture 机制,实现了 CPU 和 GPU 之间高效、灵活的内存管理。本文档详细阐述 libhsakmt 中 aperture 的类型、设计原理和使用场景。
DeeplyMind2 个月前
linux·amdgpu·dma-buf·rocm·kfd·rocr
AMD rocr-libhsakmt分析系列6-2:共享机制-import前文:AMD rocr-libhsakmt分析系列6-1:共享机制-export分析了export hsa的bo,本文分析import graphics传过来的bo。
DeeplyMind3 个月前
linux·驱动开发·ai·drm·amdgpu·kfd
linux drm子系统专栏介绍本专栏聚焦 Linux 内核中DRM(Direct Rendering Manager)图形子系统这一核心技术模块,旨在打破图形驱动开发的知识壁垒,通过系统化拆解核心对象与机制,为开发者、技术爱好者提供清晰易懂的底层原理解读与实现逻辑分析,助力开发者从 “知其然” 到 “知其所以然”。
DeeplyMind3 个月前
linux·驱动开发·1024程序员节·amdgpu·kfd·rocr
AMD rocr-libhsakmt分析系列3-4:svm-reserve模式实现分析在AMD ROCm平台的内存管理中,SVM(Shared Virtual Memory)允许CPU和GPU共享统一的虚拟地址空间。init_svm_apertures函数负责初始化SVM地址空间(aperture),以便后续的内存分配和映射操作。该函数支持两种模式:
DeeplyMind4 个月前
linux·驱动开发·amdgpu·rocm·kfd
AMD KFD的BO设计分析系列6-1: VRAM BO的显存分配分析前文:AMD KFD的BO设计分析系列6: BO的物理地址部分-PM概述了BO物理空间的核心结构体间的关系,根据分配位置的不同,使用不同的管理器来实现物理空间的分配。本文介绍的AMD 的 VRAM 管理器(amdgpu_vram_mgr)负责为BO分配具体的设备内存(VRAM),重点分析TTM 框架下 ttm_resource 物理地址分配的代码实现,重点关注 VRAM 分配流程和物理地址的确定。
DeeplyMind5 个月前
人工智能·机器学习·amdgpu·rocm·kfd
AMD KFD驱动技术分析16:SVM Aperture在 ROCm 的 libhsakmt 内存管理体系中,dGPU共享虚拟内存(SVM)管理是高性能异构计算的核心。为满足不同类型的内存一致性需求,hsakmt 针对 dGPU SVM 设计了两种 aperture(地址空间管理器):dgpu_aperture 和 dgpu_alt_aperture。这两者分别对应非一致性(non-coherent)和一致性(coherent)的 SVM 内存分配,底层实现和使用场景各有侧重。关于SVM的原理请参见:AMD KFD驱动技术分析11:SVM原理与核心概念。
我是有底线的