ArmV8常用汇编指令2

接上文,我们来分析一些具体指令。

1.加载存储指令

Load/Store可以分为立即数、寄存器等操作,格式如下:

这里Rn和Rt均为4位,原因在于,A32/T32是16个通用寄存器。因此使用4bit刚好可以遍历所有。如果是运行在AArch64,则需要5bit。

好,上述格式问题后续再讨论,先看下指令。

在该架构中,所有数据处理都需要在通用寄存器中完成,首先需要把待处理数据从内存加载到通用寄存器,处理后把结果写入内存。

常见内存加载指令:

|-------|----------------------|---|
| LDR | Word load | |
| LDRD | Dword load | |
| LDRB | Byte load | |
| LDRH | Halfword load | |
| LDRSB | Signed byte load | |
| LDRSH | Signed haflword load | |

常见存储指令:

|------|----------------|---|
| STR | Word store | |
| STRD | Dword store | |
| STRB | Byte store | |
| STRH | Halfword store | |

在使用load/store指令时,需要了解寻址的方式。具体如下:

|---------------|-------------------|------------------------------------------------------------------------|
| 寻址模式 | 举例 | |
| 基地址寻址 | LDR r0,[r1] | 将r1中的数据加载到r0 |
| 基地址+偏移寻址(前变基) | LDR r0,[r1,#8] | 将r1+8(必须是8的倍数)的内存数据加载到r0 |
| 后变基 | LDR r0,[r1],#8 | 将r1的值加载到r0,然后再加立即数8 |
| 基地址扩展 | LDR r0,[r1,r2] | R1的值+r2的值,加载到r0 |
| PC相对地址 | LDR rx, <label> | lable内存地址赋给rx,必须是PC附近的地址 LDR\LDRB\LDRSB\LDRH\LDRSH ±4095 LDRD ±255 |

LDR伪指令(大范围内加载地址),格式如下:

LDR Rt, =<label>

当该指令第二个参数为=时,表示伪指令,否则就是普通的内存访问指令。

例如

cpp 复制代码
data:

.long 0x1

LDR R1, = data

LDR R0, [R1]

首先将数据0x1加载到寄存器R1中(伪指令);

然后第二条LDR是普通内存访问指令,以R0寄存器的值作为内存地址,加载这个内存地址的值到R0,因此R0值为0x1。

多字节内存load/store指令

<LDM|STM> {<addressing_mode>}{<cond>} Rb{!}, <register list>

LDM r10,{r0, r1, r4}

2 数据处理指令

  • 运算

|-----|--------------------------------------------|------------------------------------------------------------|
| 指令 | 含义 | 举例 |
| ADD | 不进位加 | ADD r0, r1,r2 |
| ADC | 带进位加 | |
| SUB | 不进位减 | SUB r0, r1,r2 // r0 = r1-r2 注意如果要用立即数,只能用T32 SUB Rd, r1,#1 |
| SBC | 带进位减 | |
| RSB | 不进位的反减法 | RSB r0, r1,r2 // r0 = r2-r1 |
| RSC | 带进位的反减法 | |
| CMN | 负数比较,把寄存器和另一个寄存器或者立即数取反后进行比较,更新CPSR条件标志位的值 | CMN r1,#100 //r1的值和100相加,根据结果设置CPSR标志位 |
| CMP | 比较 | CMP r1, #100 //r1-100,根据结构设置CPSR标志位,不存储结果 |
| AND | 逻辑与 | |
| BIC | 位清除:用Operand2中相应位的补码对Rn中的位执行与运算 | BIC Rd, Rn,Oprand2 |
| EOR | 逻辑或 | |
| TST | 用Operand2测试Rn(按位与),不改变Rn,值更新标志位 | TST Rn, Operand2 |
| TEQ | 用Operand2测试Rn(按位异或),不改变Rn,值更新标志位 | TEQ Rn, Operand2 |
| MOV | Copy | MOV r0,r1 //copy r1 to r0 |

  • 移位、旋转

其中,ASR:算数右移,带符号的右移,符号bit位是[32];右移n位,左边被移走的n位用符号bit[31]进行填充

  • 乘除法
  • 位操作
  • 字节反转

3 控制流指令

  • 分支指令

B:跳转

BL:带返回地址(存放到R14)的跳转

BLX:带指令转换、返回地址的跳转 BLX Rn 当Rnbit0置1时,切到T32;置0,切到A32

  • CBZ/CBNZ

语法格式:CB(N)Z <Rn>, <label>

CBZ 如果Rn等于0,则跳转到label指向

CBNZ 如果Rn不等于0,跳转到label

注意,该指令只能branch 4到130byte

  • IT{T/E}{T/E}{T/E} <cond>
  • Supervisor Call(SVC)/Hypervisor Call(HVC)

语法:SVC #imm。SVC指令导致异常。这意味着处理器模式变为Supervisor,即CPSR保存为Supervisor模式SPSR,并执行分支到SVC向量。Imm被处理器忽略。但是,异常处理程序可以检索它,以确定正在请求什么服务

HVC #imm 处理器进入Hyp模式,CPSR值保存到Hyp模式SPSR,执行分支到HVC向量。

HVC不能处于IT块里

4 Misc指令

  • 协处理器指令

CDP 初始化一个协处理器数据处理操作

MRC 将协处理器的值移动到ARM寄存器

MCR 将ARM寄存器值移动到协处理器

LDC 从内存中加载到协处理器寄存器

STC 从协处理器存储到内存

  • PSR访问

使用MSR 从通用寄存器(或者立即数)传输数据给SPSR/CPSR;

使用MRS把CPSR/SPSR内容传递给通用寄存器,例如下面这段代码

MRS r0,CPSR // read CPSR into r0

BIC r0,r0,#0x80 //清除IRQ mask,使能IRQ

MSR CPSR_c, r0 //只修改CPSR_c这一个bit

SETEND 用于选择数据访问是大端还是小端(用于选择大小端混用系统)

  • BKPT\WFI\NOP等

BKPT Breakpoint,用于debug代理商

WFI wait for interrupt ,cpu切至standby、等待debug或者中断时间

NOP,没有操作

5 新的A32/T32指令

6 DSP

DSP指令都是single instruction multiple data

相关推荐
byte轻骑兵20 小时前
嵌入式 ARM Linux 系统构成全解:从硬件到应用层层剖析
linux·arm开发·arm·嵌入式开发
Linux运维技术栈1 天前
基于CVE安全公告号,全面修复麒麟ARM系统OpenSSH漏洞
安全·系统安全·arm
Crossoads1 天前
【汇编语言】call 和 ret 指令(一) —— 探讨汇编中的ret和retf指令以及call指令及其多种转移方式
android·开发语言·javascript·汇编·人工智能·数据挖掘·c#
TeYiToKu2 天前
笔记整理—linux驱动开发部分(13)块设备
linux·c语言·驱动开发·笔记·嵌入式硬件·arm
Crossoads2 天前
【汇编语言】转移指令的原理(三) —— 汇编跳转指南:jcxz、loop与位移的深度解读
android·汇编·人工智能·redis·单片机·深度学习·机器学习
zhuqiyua3 天前
深入解析Kernel32.dll与Msvcrt.dll
汇编·microsoft·windbg·二进制·dll
Crossoads4 天前
【汇编语言】数据处理的两个基本问题(三) —— 汇编语言的艺术:从div,dd,dup到结构化数据的访问
android·linux·运维·服务器·汇编·机器学习·数据挖掘
Crossoads4 天前
【汇编语言】数据处理的两个基本问题(二) —— 解密汇编语言:数据长度与寻址方式的综合应用
android·java·开发语言·javascript·汇编·数据挖掘·c#
fareast_mzh4 天前
no matching manifest for linux/amd64 in the manifest list entries
docker·arm·raspberry·busybox
yanlaifan5 天前
ARM(安谋) China处理器
arm