ARM 汇编基础

ARM 汇编是嵌入式开发、操作系统底层编程和性能优化的核心技能之一。以下是一份系统的 ARM 汇编指令教学指南,涵盖基础语法、核心指令、编程模式和实用示例。

​1. ARM 汇编基础

​ 1.1 寄存器

ARM 架构(32位)包含 ​16 个通用寄存器​(R0-R15),其中部分有特殊用途:

​R0-R12:通用寄存器,用于存储数据和地址。

​R13 (SP):栈指针(Stack Pointer),指向当前栈顶。

​R14 (LR):链接寄存器(Link Register),保存函数返回地址。

​R15 (PC):程序计数器(Program Counter),指向下一条要执行的指令。

​CPSR:当前程序状态寄存器(Condition Program Status Register),存储条件标志(如 Z、N、C、V)。

​2. ARM 汇编指令格式

ARM 指令通常遵循以下格式:

<操作码>{条件码}{S} <目标寄存器>, <操作数1>, <操作数2>

​条件码​(可选):如 EQ(相等)、NE(不等)、GT(大于)。

​S​(可选):更新 CPSR 标志(如 ADDS 会更新 Z/N/C/V 标志)。

​操作数:可以是寄存器、立即数或内存地址。

​3. 核心指令分类

​3.1 数据传输指令

MOV:将数据从一个寄存器或立即数复制到另一个寄存器。

clike 复制代码
MOV R0, #42       ; R0 = 42
MOV R1, R0        ; R1 = R0

LDR/STR:从内存加载数据到寄存器(Load)或从寄存器存储到内存(Store)。

clike 复制代码
LDR R0, [R1]      ; R0 = 内存地址[R1]处的值
STR R2, [R3, #4]  ; 将 R2 的值存储到内存地址 R3 + 4

​3.2 算术运算

ADD/SUB:加法和减法。

clike 复制代码
ADD R0, R1, R2    ; R0 = R1 + R2
SUB R3, R3, #1    ; R3 = R3 - 1

MUL/MLA:乘法和乘加。

clike 复制代码
MUL R0, R1, R2    ; R0 = R1 * R2
MLA R0, R1, R2, R3 ; R0 = R1 * R2 + R3

​3.3 逻辑运算

AND/ORR/EOR/BIC:按位与、或、异或、位清除。

clike 复制代码
AND R0, R1, #0xFF ; R0 = R1 & 0xFF(取低8位)
BIC R0, R1, #0x3  ; R0 = R1 & ~0x3(清除最低2位)

​3.4 比较与分支

CMP:比较两个操作数并更新 CPSR。

clike 复制代码
CMP R0, R1        ; 计算 R0 - R1,更新标志位

B/BL:无条件跳转(Branch)或带链接的跳转(Branch with Link,用于函数调用)。

clike 复制代码
B   loop          ; 跳转到标签 loop
BL  my_function   ; 调用函数 my_function,返回地址存入 LR

​3.5 栈操作

PUSH/POP:压栈和弹栈操作(需指定寄存器列表)。

clike 复制代码
PUSH {R0, R1, LR} ; 将 R0, R1, LR 压入栈
POP  {R0, R1, PC} ; 从栈中恢复 R0, R1,并将返回地址写入 PC(函数返回)

​4. 寻址模式

​4.1 立即数寻址

使用 # 前缀表示立即数:

clike 复制代码
MOV R0, #0x100    ; R0 = 0x100

​注意:ARM 立即数需满足特定规则(如 8 位有效位 + 移位)。

​4.2 寄存器间接寻址

通过寄存器中的地址访问内存:

clike 复制代码
LDR R0, [R1]      ; R0 = 内存地址[R1]处的值
STR R2, [R3, #4]  ; 存储到地址 R3 + 4

​4.3 基址变址寻址

支持偏移、前变址和后变址:

clike 复制代码
LDR R0, [R1, #8]! ; 前变址:R1 = R1 + 8,然后 R0 = [R1]
LDR R0, [R1], #8  ; 后变址:R0 = [R1],然后 R1 = R1 + 8

​5. 控制结构

​5.1 条件分支

根据 CPSR 标志跳转:

clike 复制代码
CMP R0, #10        ; 比较 R0 和 10
BGT greater_than    ; 若 R0 > 10,跳转到 greater_than

​5.2 循环

使用条件分支实现循环:

clike 复制代码
MOV R0, #0         ; 初始化计数器
loop:
  ADD R0, R0, #1   ; 计数器加1
  CMP R0, #5
  BLT loop         ; 若 R0 < 5,继续循环

​6. 函数调用

遵循 ​AAPCS​(ARM Architecture Procedure Call Standard)规范:

​参数传递:前 4 个参数通过 R0-R3 传递,后续参数通过栈传递。

​返回值:通过 R0 返回。

​保存寄存器:被调用函数需保护 R4-R11、SP、LR 等寄存器。

​示例:函数调用

clike 复制代码
.global main
main:
  MOV R0, #5       ; 参数 n = 5
  BL  factorial    ; 调用 factorial 函数
  BX  LR           ; 返回

factorial:
  PUSH {R4, LR}    ; 保存寄存器
  MOV R4, R0       ; 保存参数到 R4
  CMP R4, #1
  MOVEQ R0, #1     ; 若 n == 1,返回 1
  POPEQ {R4, PC}   ; 恢复寄存器并返回

  SUB R0, R4, #1   ; 计算 n-1
  BL  factorial    ; 递归调用 factorial(n-1)
  MUL R0, R4, R0   ; R0 = n * factorial(n-1)
  POP {R4, PC}     ; 恢复寄存器并返回

​7. 常见问题与调试

​7.1 立即数限制

如果立即数过大,需分步加载或使用 LDR 伪指令:

clike 复制代码
LDR R0, =0x12345678 ; 加载任意32位立即数(编译器自动处理)

​7.2 条件执行

几乎所有 ARM 指令都可条件执行:

clike 复制代码
ADDEQ R0, R1, R2    ; 仅在 Z 标志置位时执行加法

​7.3 调试工具

​GDB:使用 arm-none-eabi-gdb 调试汇编代码。

​QEMU:模拟 ARM 硬件环境。

​Keil/STM32CubeIDE:针对嵌入式硬件的集成调试环境。

8. 完整示例:计算阶乘

clike 复制代码
.global main
main:
  MOV R0, #5       ; 计算 5!
  BL  factorial
  B   exit

factorial:
  CMP R0, #1       ; 基准条件:n == 1
  MOVEQ PC, LR     ; 若满足,直接返回
  PUSH {R0, LR}    ; 保存当前 n 和返回地址
  SUB R0, R0, #1   ; n = n - 1
  BL  factorial    ; 递归调用 factorial(n-1)
  POP {R1, LR}     ; 恢复原 n 到 R1 和返回地址
  MUL R0, R1, R0   ; R0 = n * factorial(n-1)
  BX  LR           ; 返回

exit:
  ; 此处可添加退出代码
相关推荐
学不动CV了16 小时前
ARM单片机启动流程(二)(详细解析)
c语言·arm开发·stm32·单片机·51单片机
XMAIPC_Robot1 天前
基于ARM+FPGA的光栅尺精密位移加速度测试解决方案
arm开发·人工智能·fpga开发·自动化·边缘计算
学不动CV了1 天前
数据结构---链表结构体、指针深入理解(三)
c语言·arm开发·数据结构·stm32·单片机·链表
szxinmai主板定制专家1 天前
【精密测量】基于ARM+FPGA的多路光栅信号采集方案
服务器·arm开发·人工智能·嵌入式硬件·fpga开发
Paper_Love1 天前
x86-64_windows交叉编译arm_linux程序
arm开发·windows
liulilittle1 天前
C++ i386/AMD64平台汇编指令对齐长度获取实现
c语言·开发语言·汇编·c++
工业互联网专业1 天前
汇编与接口技术:8259中断实验
汇编·单片机·嵌入式硬件·8259中断实验
奇文怪式1 天前
VSCode+arm-none-eabi-gcc交叉编译+CMake构建+OpenOCD(基于Raspberry Pico RP2040)
arm开发·ide·vscode·rp2040
Imagine Miracle1 天前
Ubuntu for ARM 更换为阿里云镜像源
arm开发·ubuntu·阿里云
wwwlyj1233211 天前
arm 精准总线错误与非精准总线错误
arm开发