ARM 架构中的数据内存屏障指令 DMB

ARM 架构中的数据内存屏障指令 DMB

本文来自于我关于 ARM架构中内存屏障和同步指令的系列文章。欢迎阅读、点评与交流~

1、ARM 架构中的数据内存屏障指令 DMB

2、ARM 架构中的数据同步屏障指令 DSB

3、ARM 架构中的指令同步屏障 ISB

核心定义

数据内存屏障指令 DMB 是一种同步指令 ,用于保证在它之前的所有内存访问(读/写)操作,在它之后的所有内存访问操作开始之前,已经完成

简单来说,它是一个"栅栏"或"路障",告诉处理器:"把我前面所有关于内存的操作都搞定,再处理后面的。"


为什么需要 DMB?

主要原因在于现代处理器(包括ARM)的乱序执行多级缓存架构。

  1. 乱序执行 :为了提高性能,CPU和编译器可能会对没有依赖关系的指令进行重新排序。在单核程序中,这通常没问题,因为最终结果保持一致。但在多核/多线程环境下,这种重排序可能导致其他处理器看到不一致的内存状态。
  2. 缓存:每个CPU核心有自己私有的缓存。一个核心对内存的修改,不会立即被其他核心看到。DMB可以与其他同步机制配合,确保内存操作的全局可见性顺序。

没有DMB会导致的问题示例(典型的生产者-消费者场景):

假设有两个核心,共享两个变量:

  • flag (表示数据是否就绪)
  • data (实际数据)

生产者核心(Core A)执行:

assembly 复制代码
STR  R1, [data]    // 1. 写入数据
STR  #1, [flag]    // 2. 设置标志位为1,表示数据就绪

由于乱序执行,Core A的这两条写入指令在全局内存顺序上可能被其他核心看到是颠倒的 (即Core B先看到 flag=1,后看到新的 data)。

消费者核心(Core B)执行:

assembly 复制代码
loop:
    LDR  R2, [flag]    // 检查标志位
    CMP  R2, #0
    BEQ  loop          // 如果为0,循环等待
    LDR  R3, [data]    // 读取数据

如果Core B先看到了 flag=1(但此时 data 的更新还未可见),它就会去读取旧的、未更新的 data,导致程序逻辑错误。

解决方法:在生产者核心的两条写入指令之间插入DMB。

assembly 复制代码
STR  R1, [data]    // 1. 写入数据
DMB                // 屏障:保证步骤1的写入在任何后续写入之前完成
STR  #1, [flag]    // 2. 设置标志位

现在,Core B绝对不会在见到新的 flag 之前,见不到新的 data


DMB 的语法和参数

在ARM汇编中,DMB指令可以带一个选项,用来指定屏障的作用域,以在性能和正确性之间取得平衡。

语法:DMB <option>

常见的选项(基于ARMv7/v8架构):

选项 含义 作用域
SY 全系统屏障 影响系统中的所有观察者(所有其他CPU核心、GPU、DMA控制器等)。这是最严格、最常用的选项。
ISH 内部可共享域屏障 只影响当前CPU集群内(通常指共享L2/L3缓存)的所有核心。
NSH 非可共享屏障 只影响当前核心的流水线,不保证对其他核心的可见性。用于保证本核心指令的顺序。
OSH 外部可共享域屏障 影响当前核心所在域之外的可共享观察者(例如,对其他集群或系统组件)。

在Linux内核驱动或底层代码中,最常用的是 DMB SY


DMB 与其他屏障指令的关系

ARM架构有一组内存屏障指令:

  1. DMB(数据内存屏障)

    • 关注点:内存访问指令之间的顺序
    • 保证屏障前后的Load(读)和Store(写) 指令的相对顺序。
    • 它不保证这些访问何时对他人可见,只保证本核心发出的访问请求的顺序。
  2. DSB(数据同步屏障)

    • 比DMB更严格
    • 它不仅像DMB一样排序访问,还会等待 屏障之前的所有内存访问彻底完成 (例如,缓存写入、总线事务结束),然后再执行屏障后的任何指令(不仅仅是内存访问)。
    • 常用在更改内存映射(如修改页表)、切换上下文等需要确保之前操作完全生效的场景。
  3. ISB(指令同步屏障)

    • 刷新处理器流水线 ,确保所有先前指令都执行完毕,然后从缓存或内存中重新预取指令
    • 常用在写入系统控制寄存器(如MMU、缓存配置)之后,确保后续指令使用新的配置执行。

一个简单比喻

  • DMB :像工地上的工头,对工人们喊:"先把所有运砖的活干完,才能开始运沙子的活!"(只排序任务类型)。
  • DSB :工头喊:"所有运砖的活必须全部完工、砖块到位验收,任何人才能开始下一项工作!"(等待完成并排序)。
  • ISB :工头喊:"全体休息5分钟,忘记刚才所有工作安排,然后听我发布新指令!"(清空流水线,重新开始)。

在高级语言中的使用

你通常不会直接写DMB指令。高级语言通过以下方式使用它:

  • C/C++ :使用编译器内置函数(如GCC的 __asm__ volatile("dmb sy" ::: "memory"))或调用操作系统提供的屏障API。
  • Linux内核 :使用 mb(), rmb(), wmb() 等宏,它们会根据架构展开为相应的DMB/DSB指令。
  • C++11/Java :使用原子操作(std::atomic)或特定的内存序(如 std::memory_order_seq_cst, std::memory_order_acquire/release),编译器会在生成的机器码中自动插入必要的内存屏障。

总结

DMB的核心价值 在于:它是在一个弱内存序模型 的架构(如ARM)上,实现多核并发程序正确性基础硬件原语。它通过在关键位置强制内存操作的顺序,使得程序员和编译器能够推理并控制多线程间的内存可见性,从而构建出可靠的锁、无锁数据结构、同步机制等。

简言之:DMB是让混乱的、为性能而优化过的内存访问世界,恢复到一个程序员可以理解和控制的、有序状态的关键工具。

相关推荐
bobuddy32 分钟前
射频收发机架构简介
架构·射频工程
桌面运维家44 分钟前
vDisk考试环境IO性能怎么优化?VOI架构实战指南
架构
一个骇客2 小时前
让你的数据成为“操作日志”和“模型饲料”:事件溯源、CQRS与DataFrame漫谈
架构
鹏北海-RemHusband3 小时前
从零到一:基于 micro-app 的企业级微前端模板完整实现指南
前端·微服务·架构
2的n次方_5 小时前
Runtime 内存管理深化:推理批处理下的内存复用与生命周期精细控制
c语言·网络·架构
前端市界6 小时前
用 React 手搓一个 3D 翻页书籍组件,呼吸海浪式翻页,交互体验带感!
前端·架构·github
文艺理科生6 小时前
Nginx 路径映射深度解析:从本地开发到生产交付的底层哲学
前端·后端·架构
C澒6 小时前
Vue 项目渐进式迁移 React:组件库接入与跨框架协同技术方案
前端·vue.js·react.js·架构·系统架构
陌上花开缓缓归以6 小时前
LiteOS和RTOS 系统选型分析
arm开发
消失的旧时光-19437 小时前
从 Kotlin 到 Dart:为什么 sealed 是处理「多种返回结果」的最佳方式?
android·开发语言·flutter·架构·kotlin·sealed