PCIe的ATS和PRS

在 PCIe(高速外设互联)协议中,ATS ​ 和 PRS ​ 是一对协同工作的机制,主要用于解决 I/O 设备 DMA 内存访问​ 的效率与灵活性问题。它们让设备(如网卡、GPU)能像 CPU 一样使用虚拟地址,并处理"缺页"异常。

核心概念速览

缩写 全称 中文 核心职责 类比理解
ATS Address Translation Services 地址转换服务 "查字典":将虚拟地址(VA)翻译成物理地址(PA)。 相当于设备端的 MMU/TLB
PRS Page Request Services 页请求服务 "要内存":当翻译失败(页不在内存)时,请求系统调入页面。 相当于设备端的 缺页中断

机制深度解析

1. ATS (Address Translation Services)

ATS 是 PCIe 规范(自 3.0 起)定义的基础服务,旨在降低 DMA 延迟减少 IOMMU 瓶颈

  • 工作原理

    1. 请求:PCIe 设备(Endpoint)在发起 DMA 前,如果不知道物理地址,会向 Root Complex(RC)发送 ATS 转换请求(ATR)。

    2. 翻译:RC 侧的 IOMMU/TA(转换代理)查询页表,返回物理地址及权限。

    3. 缓存 :设备将 虚拟地址 -> 物理地址的映射缓存到本地的 ATC(Address Translation Cache)中。

    4. 加速:后续访问同一页面时,设备直接查 ATC,无需经过 IOMMU,极大提升了效率。

  • 解决的问题

    • 避免每次 DMA 都经过 IOMMU 查表,减轻主机侧压力。

    • 支持设备直接使用虚拟地址(IOVA),便于与 CPU 共享地址空间(SVA)。

2. PRS (Page Request Services)

PRS 是构建在 ATS 之上的扩展机制,用于处理内存换页(Paging)场景。它允许设备访问被换出到磁盘的内存。

  • 触发条件

    当设备发起 ATS 请求时,IOMMU 发现该虚拟地址对应的物理页不在内存中(缺页),返回一个"转换失败"或"页不存在"的响应。

  • 工作流程

    1. 请求 :设备收到 ATS 失败后,发送 Page Request Message​ 给主机,说明"我需要这个页"。

    2. 换入:主机 OS 执行缺页处理,将数据从磁盘换入物理内存,并建立页表映射。

    3. 响应 :主机通过 Page Response Message​ 通知设备"页已就绪"。

    4. 重试:设备重新发起 ATS 请求,获取新的物理地址,完成 DMA。

  • 核心价值

    • 取消 Pinning:传统 DMA 必须锁定(Pin)内存以防被换出。PRS 允许内存换页,大幅提升系统内存利用率。

    • 支持共享虚拟内存:设备可以和 CPU 进程共享同一虚拟地址空间,即使该内存被换出也能恢复。

两者关系与依赖

  • 依赖关系 :PRS 必须依赖 ATS 存在。设备必须先通过 ATS 尝试翻译,才能触发 PRS 流程。ATS 是基础,PRS 是补充

  • 协同流程

    设备 DMA -> 查本地 ATC(Miss)-> 发 ATS 请求 -> IOMMU 返回缺页 -> 发 PRS 请求 -> 主机换页 -> 重试 ATS -> 成功 DMA

应用场景与硬件要求

  • 典型场景

    • 高性能计算:GPU 或智能网卡(SmartNIC)需要直接访问用户态虚拟内存。

    • 虚拟化:SR-IOV 场景下,虚拟机内的设备直接访问宿主机内存。

    • 大内存服务器:避免因 DMA 锁定大量物理内存导致系统僵死。

  • 硬件支持

    • 设备端(EP):必须支持 ATS 和 PRS 能力,并内置 ATC 缓存。

    • 主机端(RC):CPU/芯片组需支持 IOMMU(如 Intel VT-d, AMD-Vi)且驱动支持 PRS 处理。

简单来说,ATS 负责"快",PRS 负责"活"。ATS 让设备 DMA 更快,PRS 让设备 DMA 更灵活,不再受限于物理内存锁定。

相关推荐
汽车仪器仪表相关领域1 小时前
HORIBA MEXA-584L 全功能汽车排放废气分析仪:便携精准排放检测 + 多参数同步测量 + 国六 / 欧 7 合规适配,汽车检测与调校的黄金标准
服务器·数据库·人工智能·功能测试·汽车·压力测试·可用性测试
TechWayfarer1 小时前
账号安全实战:基于IP归属地基线的三原则异地登录风控模型
服务器·网络·python·安全·网络安全
南境十里·墨染春水1 小时前
线程池学习(二)线程池理解
java·jvm·学习
ZGi.ai1 小时前
私有化大模型接入企业系统:SSO+权限+API网关完整方案
java·开发语言·大模型·私有化部署·sso·企业架构
Han_han9191 小时前
集合进阶(Map集合):
java
吴声子夜歌1 小时前
Java——文件和目录操作
java·文件·目录
qq_366086221 小时前
SQL 中 OR 与 UNION ALL选择指南
数据库·sql
吴声子夜歌1 小时前
Java——随机
java·random·随机
正在走向自律1 小时前
时序数据库技术内幕:从大数据存储模型看工业级时序数据库的设计与落地
大数据·数据库·时序数据库·工业物联网存储·tsfile 存储引擎·大数据时序技术·物联网数据治理