2024王道考研计算机组成原理——指令系统

一、指令格式

操作码:做什么 地址码:对谁做

当然停机指令特殊,不需要地址码,就是执行一个特殊的命令而已

Intel架构在CPU使用的是x86架构,x86架构的指令集和AMD的指令集是不兼容的,不能跨不同指令系统的机器执行,苹果公司宣布要抛弃Intel的CPU,转而开发自己的基于ARM架构的CPU,这样手机和电脑就能通用了

了解即可:

堆栈型计算机通过零地址指令来进行算术运算:操作数是隐藏在栈里面的,而不会显示地在栈中指明,扫描到操作符就相当于扫描到了一个零地址指令,会把操作数计算/弹出堆栈

所有指令访存次数都要加上取指令的那一次

注意:指令字长的长度是可变的(但是得是比如1B的整数倍),机器字长和存储字长都是不可变的

如果指令字长超过机器字长的话就需要多次的取指令操作,CPU可以根据操作码的类型来判断

我们所有的指令都是遵循操作码+地址码这种格式,只是地址码有可能为0,只有操作码这种情况出现,表示仅执行一次特殊的操作

二、扩展操作码指令格式

操作码全1用于区分是几地址指令

这里重点讨论的是n位操作码,能表示2^n种对于3/2/1地址的操作

三地址:15条0000-1110 A1 A2 A3

二地址(12条):1111 0000-1011 A1 A2

一地址(62条):1111 11 000000-111101 A1

零地址(32条):1111 11 11111 00000-11111

cpu分析指令的时候就根据前几位是1来判断他是几地址指令

三、指令寻址

PC+"1"

指令系统采用定长指令字结构: 定长指令+可变长操作码

因为每一条指令的长度是确定的,所以+"1"即可处理下一条指令

指令执行的时候先读入一个字

这里我想给大家重点讲解一下!!!!!!!!!!!!!!!!!!!!!!!

你CPU不是要从内存当中取指令吗?因为CPU一次最多只能同时处理一个字的数据,你就直接去指令所在的内存单元(在PC里存放地址)去取出一个字的内容,但是啊这一个字不是都有效啊!我CPU处理第一个字节的时候发现是55,后面直接扔掉就是了,然后根据55我就能知道这条指令的长度了,也就能知道PC应该加几了!然后可以继续去取下一条地址了!!!!!!!!

四、数据寻址

根据寻址特征和形式地址可以确定操作数的真实地址(EA)

了解即可,不用看:

立即寻址:立即数#010

直接寻址:call 0x12345678

间接寻址:lea [0x123456],地址放在某个内存单元里面

寄存器寻址:push ebp;mov eax,ecx

寄存器间接寻址:push [eax+4]

基址寻址就是用于多道程序并发执行的

直接寻址的bug:要用一堆地址

如何解决? esi edi就是变址寄存器,用于实现循环:rep stosw

直接寻址:地址是几就是几,你位置移动也是跳到2那里

(如何解决这个问题?)

你移动代码对顺序执行的指令没啥影响,但是跳转指令难绷啊😂😂😂

所以只要修改跳转指令的解释方式:因为PC会自动+1,所以使用-4(补码)来指示当前的CPU情况下应该跳转到哪里去执行

转移指令使用的都是相对寻址!!!

基址寻址:整个代码在内存当中的浮动;相对寻址:一段代码在程序内部的浮动

比较(相减)和跳转是分开的

PSW就是我们熟悉的ELAPGS

五、x86汇编语言基础

指令格式是什么样的取决于你的CPU,硬编码就是指令集里面的指令

55就是opcode,66就是前缀,CPU根据值来判断

55为啥是push ebp而不是push bp和当前CPU的模式有关,x86的保护模式默认是32位

前缀指令分成4个组,每个组有n个最多出现一个

定长指令:opcode确定了,指令的长度就确定了

变长指令:即使opcode确定了,指令的长度依然无法确定

opcode决定了有没有ModR/M,也决定了是不是定长指令

比如opcode是88那它后面一定根一个opcode

地址偏移和立即数

比如这种考题:

为啥x86汇编语言不允许两个操作数都同时来自主存?

1、指令长度太长了

2、访问2次主存太慢了吧。。。

x86:intel的8086/80286 80386

一条指令由操作码和若干地址码组成

进行除法运算的时候要对被除数进行位扩展:32->64(edx:eax) ,商存入eax,余数存入edx

intel格式(Windows)&AT&T(Linux&Unix)格式(汇编格式)

六、C语言选择语句的汇编实现

在x86当中IP就是PC

和前面提到的一样,我们这样写汇编代码,但是其实最后变成机器码的时候他会给我们翻译成与PC有关的指令,这样代码段即使移动位置,当PC指向这条语句的时候也能够跳转到正确的地址(使用PC+一个补码)

使用标号可以更方便程序员去编写汇编代码,最后编译器要做的就是把这个标号改成对于的地址

条件转移指令通常与cmp指令配合食用🤣🤣🤣

switch语句:离散情况不生成大表和if...else效率一样,连续的时候生成大表,先比较数值-1超过第二大的数就直接跳到default,否则直接根据edx*4+func(函数首地址) 来去查大表,直接得到跳转地址而不用像if..else那样进行多次的比较!!!

只有特定的指令(比如运算指令,和ALU有关,本质上不就是加法器那些产生的符号位吗?)才会修改PSW寄存器里面的标志位,cmp指令本质上就是做了一个减法(但是结果不保存,只改变符号位),产生了符号位,然后条件转移指令再根据减法所产生的标志位(去PSW寄存器中获取)来决定要不要进行跳转!!!

六、C语言循环语句的汇编实现

i++后面紧跟的就是cmp,一旦越界就跳出循环

for:①先初始化,第一次直接判断是否跳出循环

②循环主体&i++③cmp i ,cnt(没结束就往上跳是for循环的一大重要特征!)

七、C语言函数调用的汇编视角

x86的push和pop默认是按照4字节压栈/出栈的

esp指向的是栈顶的位置(有元素)

push eax:①先sub esp,4 ②再mov [esp],eax

pop eax:①先mov eax,[esp] ②再add esp,4

call eax:①push eip ②jmp eax

ret:pop eip(默认是ret 4)

真实的堆栈以及函数调用:

所谓堆栈平衡就是函数调用前和调用后esp和ebp的位置保持不变!

试试看能不能画到堆栈平衡?

外平栈(默认采用的调用约定):cdcall(右左,外平栈:add esp,8)

内平栈:stdcall(右左,内平栈:ret 8(相当于add esp,8))

注意:一个线程里面的所有函数都使用同一个堆栈

int main(){

fun(2,3); push 3 push 2 call fun(push eip + jmp fun)

}

fun:

八、CICS和RISC指令集的对比

你RISC只能通过寄存器来访存,寄存器可不得比CICS多吗?

相关推荐
yttandb31 分钟前
重生到现代之从零开始的C语言生活》—— 内存的存储
c语言·开发语言·生活
结衣结衣.1 小时前
python中的函数介绍
java·c语言·开发语言·前端·笔记·python·学习
五味香1 小时前
C++学习,信号处理
android·c语言·开发语言·c++·学习·算法·信号处理
梓䈑2 小时前
【C语言】自定义类型:结构体
c语言·开发语言·windows
PYSpring2 小时前
数据结构-LRU缓存(C语言实现)
c语言·数据结构·缓存
TANGLONG2222 小时前
【C语言】数据在内存中的存储(万字解析)
java·c语言·c++·python·考研·面试·蓝桥杯
@qike3 小时前
【C++】—— 日期类的实现
c语言·c++·笔记·算法·学习方法
f狐0狸x3 小时前
C语言指针plus版练习
c语言·指针
江奖蒋犟4 小时前
【初阶数据结构】排序——归并排序
c语言·数据结构·算法
感谢地心引力4 小时前
【MATLAB2024b】安装离线帮助文档(windows)
windows·matlab