Linux arm64 IOMMU总结

一、DMA的引入

Non-DMA:CPU直接与设备进行数据交互,CPU的负载会随着数据的读写而增加;

DMA:CPU不参与数据的直接传输,DMA Controller负责Device与Memory之间的数据搬运,并以中断信号的形式通知CPU;

可以看出,DMA可以提高CPU的使用率。

二、IOMMU与DMA的关系

可以看出,IOMMU是DMA过程中的一环,也是实现DMA的一种手段。(当然DMA也可以不走IOMMU,但是有的安全隐患)

三、IOMMU的作用

1、IOMMU是设备访问物理地址的媒介, IOMMU使得设备无法直接访问物理地址,大大增加了设备进行DMA攻击的难度。(安全性)

2、部分设备的引脚数较少,导致其位数较低,无法寻址到整个物理内存空间。(成本原因?越多引脚意味着更大的寻址范围(越多的bit位))

以目前主流的32位设备为例,其在物理内存中直接寻址的范围是[0, 4GB)。但是,现代操作系统的内存往往大于4GB。如果设备申请DMA时,内核为设备分配的DMA buffer的地址高于4GB(以下简称为"high buffer"),则设备将无法寻址到它。

有了IOMMU以后,IOMMU就可以在[0, 4GB)范围内分配一段与高地址buffer长度相同的内存,让设备能够直接寻址(以下称为"low buffer")。设备向low buffer写入后,IOMMU就会将low buffer中的内容,复制到high buffer,而后通知CPU从high buffer读取内容。反之亦然------CPU向high buffer写入后,IOMMU就会将high buffer中的内容,复制到low buffer,而后通知设备从low buffer读取内容。这样,CPU和设备都能读取到对方写入的内容。这样在high buffer和low buffer之间复制内容的操作,在IOMMU机制中被称为"sync"或"bounce"。(重点)

读者可能会想,内存的复制,在内核中,不就是调用memcpy()函数来实现的吗?没错,这就是本文要介绍的IOMMU的软件实现方式------SWIOTLB。之所以说是软件实现,是因为sync操作在底层正是调用memcpy()函数,这完全是软件实现的。

四、IOMMU的分类

1、软件IOMMU(SWIOTLB)

2、硬件IOMMU(Intel IOMMU、AMD IOMMU)(与各个厂商的硬件实现有关)

五、SWIOTLB

SWIOTLB(software input/output table translation lookaside buffer)(软件IO地址转换缓冲区)

SWIOTLB的作用在于,使得寻址能力较低、无法直接寻址到内核所分配的DMA buffer的那些设备,也能够进行DMA操作

在目前主流的Linux操作系统中,SWIOTLB发挥作用的场合并不多见。这主要是由于以下原因:

现代的外部设备,通常都是32位或64位设备。64位设备毫无疑问可以直接寻址整个物理内存空间;而32位设备能够直接寻址的范围也达到了4G。如果操作系统运行内存不大于4G,则所有内存都可以被这些设备直接寻址到,此时设备的DMA操作,就无需SWIOTLB的辅助。

相比硬件IOMMU,SWIOTLB存在memcpy()操作,需要CPU的参与(cpu性能比不上dma控制器?),降低了效率,这是软件实现的固有弊端。

如果启动参数中同时启用SWIOTLB和硬件IOMMU(例如Intel IOMMU),那么当Linux系统启动完成后,SWIOTLB将会被禁用,而仅保留硬件IOMMU。

如果关闭IOMMU,dma 默认不会走iommu(硬件方式),而是走传统的swiotlb方式的dma(软件方式);缺点是效率较低。

六、关闭IOMMU的方式

1、grub命令行中添加 iommu.passthrough=0 参数

2、acpi表或者dts中不配置相应的smmu节点(保证不会正常设备驱动匹配)

参考ARM SMMU原理与IOMMU技术("VT-d" DMA、I/O虚拟化、内存虚拟化)_asid pasid-CSDN博客

未完待续,持续更新

参考文章:

看完秒懂:Linux DMA mapping机制分析_dma map single-CSDN博客

Linux x86-64 IOMMU详解(一)------IOMMU简介_ioxumux-CSDN博客

相关推荐
Hefin_H8 小时前
Linux 多用户服务器限制单用户最大内存使用(systemd user.slice)
linux·运维·服务器
G.Chenhui9 小时前
【Macos】安装 macFUSE 和 SSHFS 实现在 Finder 中挂载服务器目录
服务器·macos
nassi_9 小时前
开发板网络配置
linux·网络·嵌入式硬件
饼瑶9 小时前
基于AutoDL远端服务器在pycharm复现:具身智能论文pai0
服务器·elasticsearch·pycharm
阿巴~阿巴~9 小时前
Linux 信号的保存机制
linux·服务器·信号·信号集·信号保存
郝学胜-神的一滴10 小时前
使用现代C++构建高效日志系统的分步指南
服务器·开发语言·c++·程序人生·个人开发
kgduu10 小时前
go-ethereum core之交易索引txIndexer
服务器·数据库·golang
柱子子子子10 小时前
【邪修】linux (ubuntu/fedora/arch/debian) wifi hard blocked解决方法-AX210
linux·网络·ubuntu·debian
大龄Python青年10 小时前
Linux发行版Ubuntu24.04安装教程
linux·ubuntu·1024程序员节
强里秋千墙外道11 小时前
【Linux】ssh升级到最新版本-以ubuntu为例
linux·运维·ssh