ArmV8常用汇编指令2

接上文,我们来分析一些具体指令。

1.加载存储指令

Load/Store可以分为立即数、寄存器等操作,格式如下:

这里Rn和Rt均为4位,原因在于,A32/T32是16个通用寄存器。因此使用4bit刚好可以遍历所有。如果是运行在AArch64,则需要5bit。

好,上述格式问题后续再讨论,先看下指令。

在该架构中,所有数据处理都需要在通用寄存器中完成,首先需要把待处理数据从内存加载到通用寄存器,处理后把结果写入内存。

常见内存加载指令:

|-------|----------------------|---|
| LDR | Word load | |
| LDRD | Dword load | |
| LDRB | Byte load | |
| LDRH | Halfword load | |
| LDRSB | Signed byte load | |
| LDRSH | Signed haflword load | |

常见存储指令:

|------|----------------|---|
| STR | Word store | |
| STRD | Dword store | |
| STRB | Byte store | |
| STRH | Halfword store | |

在使用load/store指令时,需要了解寻址的方式。具体如下:

|---------------|-------------------|------------------------------------------------------------------------|
| 寻址模式 | 举例 | |
| 基地址寻址 | LDR r0,[r1] | 将r1中的数据加载到r0 |
| 基地址+偏移寻址(前变基) | LDR r0,[r1,#8] | 将r1+8(必须是8的倍数)的内存数据加载到r0 |
| 后变基 | LDR r0,[r1],#8 | 将r1的值加载到r0,然后再加立即数8 |
| 基地址扩展 | LDR r0,[r1,r2] | R1的值+r2的值,加载到r0 |
| PC相对地址 | LDR rx, <label> | lable内存地址赋给rx,必须是PC附近的地址 LDR\LDRB\LDRSB\LDRH\LDRSH ±4095 LDRD ±255 |

LDR伪指令(大范围内加载地址),格式如下:

LDR Rt, =<label>

当该指令第二个参数为=时,表示伪指令,否则就是普通的内存访问指令。

例如

cpp 复制代码
data:

.long 0x1

LDR R1, = data

LDR R0, [R1]

首先将数据0x1加载到寄存器R1中(伪指令);

然后第二条LDR是普通内存访问指令,以R0寄存器的值作为内存地址,加载这个内存地址的值到R0,因此R0值为0x1。

多字节内存load/store指令

<LDM|STM> {<addressing_mode>}{<cond>} Rb{!}, <register list>

LDM r10,{r0, r1, r4}

2 数据处理指令

  • 运算

|-----|--------------------------------------------|------------------------------------------------------------|
| 指令 | 含义 | 举例 |
| ADD | 不进位加 | ADD r0, r1,r2 |
| ADC | 带进位加 | |
| SUB | 不进位减 | SUB r0, r1,r2 // r0 = r1-r2 注意如果要用立即数,只能用T32 SUB Rd, r1,#1 |
| SBC | 带进位减 | |
| RSB | 不进位的反减法 | RSB r0, r1,r2 // r0 = r2-r1 |
| RSC | 带进位的反减法 | |
| CMN | 负数比较,把寄存器和另一个寄存器或者立即数取反后进行比较,更新CPSR条件标志位的值 | CMN r1,#100 //r1的值和100相加,根据结果设置CPSR标志位 |
| CMP | 比较 | CMP r1, #100 //r1-100,根据结构设置CPSR标志位,不存储结果 |
| AND | 逻辑与 | |
| BIC | 位清除:用Operand2中相应位的补码对Rn中的位执行与运算 | BIC Rd, Rn,Oprand2 |
| EOR | 逻辑或 | |
| TST | 用Operand2测试Rn(按位与),不改变Rn,值更新标志位 | TST Rn, Operand2 |
| TEQ | 用Operand2测试Rn(按位异或),不改变Rn,值更新标志位 | TEQ Rn, Operand2 |
| MOV | Copy | MOV r0,r1 //copy r1 to r0 |

  • 移位、旋转

其中,ASR:算数右移,带符号的右移,符号bit位是[32];右移n位,左边被移走的n位用符号bit[31]进行填充

  • 乘除法
  • 位操作
  • 字节反转

3 控制流指令

  • 分支指令

B:跳转

BL:带返回地址(存放到R14)的跳转

BLX:带指令转换、返回地址的跳转 BLX Rn 当Rnbit0置1时,切到T32;置0,切到A32

  • CBZ/CBNZ

语法格式:CB(N)Z <Rn>, <label>

CBZ 如果Rn等于0,则跳转到label指向

CBNZ 如果Rn不等于0,跳转到label

注意,该指令只能branch 4到130byte

  • IT{T/E}{T/E}{T/E} <cond>
  • Supervisor Call(SVC)/Hypervisor Call(HVC)

语法:SVC #imm。SVC指令导致异常。这意味着处理器模式变为Supervisor,即CPSR保存为Supervisor模式SPSR,并执行分支到SVC向量。Imm被处理器忽略。但是,异常处理程序可以检索它,以确定正在请求什么服务

HVC #imm 处理器进入Hyp模式,CPSR值保存到Hyp模式SPSR,执行分支到HVC向量。

HVC不能处于IT块里

4 Misc指令

  • 协处理器指令

CDP 初始化一个协处理器数据处理操作

MRC 将协处理器的值移动到ARM寄存器

MCR 将ARM寄存器值移动到协处理器

LDC 从内存中加载到协处理器寄存器

STC 从协处理器存储到内存

  • PSR访问

使用MSR 从通用寄存器(或者立即数)传输数据给SPSR/CPSR;

使用MRS把CPSR/SPSR内容传递给通用寄存器,例如下面这段代码

MRS r0,CPSR // read CPSR into r0

BIC r0,r0,#0x80 //清除IRQ mask,使能IRQ

MSR CPSR_c, r0 //只修改CPSR_c这一个bit

SETEND 用于选择数据访问是大端还是小端(用于选择大小端混用系统)

  • BKPT\WFI\NOP等

BKPT Breakpoint,用于debug代理商

WFI wait for interrupt ,cpu切至standby、等待debug或者中断时间

NOP,没有操作

5 新的A32/T32指令

6 DSP

DSP指令都是single instruction multiple data

相关推荐
染指11102 小时前
34.x64汇编写法(一)
汇编·x64汇编
廖致君1 天前
打打基础 | 从翻转链表到寄存器、汇编与内存
汇编·数据结构·链表
iCxhust1 天前
8088 单板机 汇编 NMI 中断程序示例 (脱离 DOS 环境)
c语言·开发语言·汇编·单片机·嵌入式硬件·mcu
WangAnChuan00332 天前
汇编中的选择语句:if/else 的机器级实现
汇编
草莓熊Lotso3 天前
【C语言编译与链接】--翻译环境和运行环境,预处理,编译,汇编,链接
c语言·开发语言·汇编·经验分享·笔记·其他
艾莉丝努力练剑3 天前
深入详解编译与链接:翻译环境和运行环境,翻译环境:预编译+编译+汇编+链接,运行环境
c语言·开发语言·汇编·学习
Hello Mr.Z3 天前
RISCV——内核及汇编
汇编·riscv
一条叫做nemo的鱼4 天前
从汇编的角度揭秘C++函数重载,原来这么简单
汇编·c++·函数重载·原理解密
謓泽5 天前
【STM32】按键控制LED & 光敏传感器控制蜂鸣器
stm32·单片机·arm
清水白石0086 天前
WebSockets 在实时通信中的应用与优化
开发语言·汇编·python·websockets