ARM 汇编基础

ARM 汇编是嵌入式开发、操作系统底层编程和性能优化的核心技能之一。以下是一份系统的 ARM 汇编指令教学指南,涵盖基础语法、核心指令、编程模式和实用示例。

​1. ARM 汇编基础

​ 1.1 寄存器

ARM 架构(32位)包含 ​16 个通用寄存器​(R0-R15),其中部分有特殊用途:

​R0-R12:通用寄存器,用于存储数据和地址。

​R13 (SP):栈指针(Stack Pointer),指向当前栈顶。

​R14 (LR):链接寄存器(Link Register),保存函数返回地址。

​R15 (PC):程序计数器(Program Counter),指向下一条要执行的指令。

​CPSR:当前程序状态寄存器(Condition Program Status Register),存储条件标志(如 Z、N、C、V)。

​2. ARM 汇编指令格式

ARM 指令通常遵循以下格式:

<操作码>{条件码}{S} <目标寄存器>, <操作数1>, <操作数2>

​条件码​(可选):如 EQ(相等)、NE(不等)、GT(大于)。

​S​(可选):更新 CPSR 标志(如 ADDS 会更新 Z/N/C/V 标志)。

​操作数:可以是寄存器、立即数或内存地址。

​3. 核心指令分类

​3.1 数据传输指令

MOV:将数据从一个寄存器或立即数复制到另一个寄存器。

clike 复制代码
MOV R0, #42       ; R0 = 42
MOV R1, R0        ; R1 = R0

LDR/STR:从内存加载数据到寄存器(Load)或从寄存器存储到内存(Store)。

clike 复制代码
LDR R0, [R1]      ; R0 = 内存地址[R1]处的值
STR R2, [R3, #4]  ; 将 R2 的值存储到内存地址 R3 + 4

​3.2 算术运算

ADD/SUB:加法和减法。

clike 复制代码
ADD R0, R1, R2    ; R0 = R1 + R2
SUB R3, R3, #1    ; R3 = R3 - 1

MUL/MLA:乘法和乘加。

clike 复制代码
MUL R0, R1, R2    ; R0 = R1 * R2
MLA R0, R1, R2, R3 ; R0 = R1 * R2 + R3

​3.3 逻辑运算

AND/ORR/EOR/BIC:按位与、或、异或、位清除。

clike 复制代码
AND R0, R1, #0xFF ; R0 = R1 & 0xFF(取低8位)
BIC R0, R1, #0x3  ; R0 = R1 & ~0x3(清除最低2位)

​3.4 比较与分支

CMP:比较两个操作数并更新 CPSR。

clike 复制代码
CMP R0, R1        ; 计算 R0 - R1,更新标志位

B/BL:无条件跳转(Branch)或带链接的跳转(Branch with Link,用于函数调用)。

clike 复制代码
B   loop          ; 跳转到标签 loop
BL  my_function   ; 调用函数 my_function,返回地址存入 LR

​3.5 栈操作

PUSH/POP:压栈和弹栈操作(需指定寄存器列表)。

clike 复制代码
PUSH {R0, R1, LR} ; 将 R0, R1, LR 压入栈
POP  {R0, R1, PC} ; 从栈中恢复 R0, R1,并将返回地址写入 PC(函数返回)

​4. 寻址模式

​4.1 立即数寻址

使用 # 前缀表示立即数:

clike 复制代码
MOV R0, #0x100    ; R0 = 0x100

​注意:ARM 立即数需满足特定规则(如 8 位有效位 + 移位)。

​4.2 寄存器间接寻址

通过寄存器中的地址访问内存:

clike 复制代码
LDR R0, [R1]      ; R0 = 内存地址[R1]处的值
STR R2, [R3, #4]  ; 存储到地址 R3 + 4

​4.3 基址变址寻址

支持偏移、前变址和后变址:

clike 复制代码
LDR R0, [R1, #8]! ; 前变址:R1 = R1 + 8,然后 R0 = [R1]
LDR R0, [R1], #8  ; 后变址:R0 = [R1],然后 R1 = R1 + 8

​5. 控制结构

​5.1 条件分支

根据 CPSR 标志跳转:

clike 复制代码
CMP R0, #10        ; 比较 R0 和 10
BGT greater_than    ; 若 R0 > 10,跳转到 greater_than

​5.2 循环

使用条件分支实现循环:

clike 复制代码
MOV R0, #0         ; 初始化计数器
loop:
  ADD R0, R0, #1   ; 计数器加1
  CMP R0, #5
  BLT loop         ; 若 R0 < 5,继续循环

​6. 函数调用

遵循 ​AAPCS​(ARM Architecture Procedure Call Standard)规范:

​参数传递:前 4 个参数通过 R0-R3 传递,后续参数通过栈传递。

​返回值:通过 R0 返回。

​保存寄存器:被调用函数需保护 R4-R11、SP、LR 等寄存器。

​示例:函数调用

clike 复制代码
.global main
main:
  MOV R0, #5       ; 参数 n = 5
  BL  factorial    ; 调用 factorial 函数
  BX  LR           ; 返回

factorial:
  PUSH {R4, LR}    ; 保存寄存器
  MOV R4, R0       ; 保存参数到 R4
  CMP R4, #1
  MOVEQ R0, #1     ; 若 n == 1,返回 1
  POPEQ {R4, PC}   ; 恢复寄存器并返回

  SUB R0, R4, #1   ; 计算 n-1
  BL  factorial    ; 递归调用 factorial(n-1)
  MUL R0, R4, R0   ; R0 = n * factorial(n-1)
  POP {R4, PC}     ; 恢复寄存器并返回

​7. 常见问题与调试

​7.1 立即数限制

如果立即数过大,需分步加载或使用 LDR 伪指令:

clike 复制代码
LDR R0, =0x12345678 ; 加载任意32位立即数(编译器自动处理)

​7.2 条件执行

几乎所有 ARM 指令都可条件执行:

clike 复制代码
ADDEQ R0, R1, R2    ; 仅在 Z 标志置位时执行加法

​7.3 调试工具

​GDB:使用 arm-none-eabi-gdb 调试汇编代码。

​QEMU:模拟 ARM 硬件环境。

​Keil/STM32CubeIDE:针对嵌入式硬件的集成调试环境。

8. 完整示例:计算阶乘

clike 复制代码
.global main
main:
  MOV R0, #5       ; 计算 5!
  BL  factorial
  B   exit

factorial:
  CMP R0, #1       ; 基准条件:n == 1
  MOVEQ PC, LR     ; 若满足,直接返回
  PUSH {R0, LR}    ; 保存当前 n 和返回地址
  SUB R0, R0, #1   ; n = n - 1
  BL  factorial    ; 递归调用 factorial(n-1)
  POP {R1, LR}     ; 恢复原 n 到 R1 和返回地址
  MUL R0, R1, R0   ; R0 = n * factorial(n-1)
  BX  LR           ; 返回

exit:
  ; 此处可添加退出代码
相关推荐
charlie1145141917 小时前
ARM架构薄记2——ARM学习架构抓手(以ARMv7为例子)
arm开发·学习·架构
satadriver18 小时前
汇编移位指令
汇编
kanhao1001 天前
MLIR中Dialect的抽象层级 简介
汇编·mlir
Invinciblenuonuo1 天前
STM32八股【2】-----ARM架构
arm开发·stm32·架构
TSINGSEE1 天前
EasyRTC轻量级Webrtc音视频通话SDK,助力带屏IPC在嵌入式设备中的应用
arm开发·微信·架构·音视频·webrtc
钡铼技术物联网关2 天前
从PLC到云端:5G嵌入式网关的MQTT协议转换与Ubuntu二次开发全解析
linux·arm开发·5g·边缘计算
zl0_00_02 天前
汇编基础知识
汇编
Teecertlabs2 天前
【机密计算顶会解读】11:ACAI——使用 Arm 机密计算架构保护加速器执行
arm开发·架构·机密计算·arm cca·可信执行环境
珹洺2 天前
C++从入门到实战(六)类和对象(第二部分)C++成员对象及其实例化,对象大小与this详解
java·开发语言·汇编·数据结构·c++·sql·算法