xianshan分支预测器BPU

xianshan分支预测器BPU

  • [1 RISC-V分支预测](#1 RISC-V分支预测)
    • [1.0 分支预测基本类型](#1.0 分支预测基本类型)
      • [1.0.1 条件分支指令](#1.0.1 条件分支指令)
      • [1.0.2 无条件分支指令](#1.0.2 无条件分支指令)
    • [1.1 方向预测](#1.1 方向预测)
      • [1.1.1 饱和计数器法](#1.1.1 饱和计数器法)
        • [1.1.1.1 Questions](#1.1.1.1 Questions)
      • [1.1.2 分支历史法--程序局部性原理](#1.1.2 分支历史法--程序局部性原理)
        • [1.1.2.1 Questions](#1.1.2.1 Questions)
    • [1.2 目标地址预测](#1.2 目标地址预测)
      • [1.2.1 分支目标缓存--BTB](#1.2.1 分支目标缓存--BTB)
    • [1.3 预测指令类型](#1.3 预测指令类型)
      • [1.3.1 直接预测指令类型](#1.3.1 直接预测指令类型)

只有预测出地址,才回去取指;因此最最开始的第一步就是PC值;
如上篇所说,分支预测器存在两方面的原因:一是程序的执行流中含有分支指令;二是CPU使用流水线设计;
在这里举个CPU执行程序的例子:

c 复制代码
int x = 10;
int y = 20;
int result = 0;

if(x>y){
    result = x + y;
}else{
    result = x - y;
}

进行翻译成RISC-V的代码:

compile 复制代码
li  a0, 10               # x = 10
li  a1, 20               # y = 20
li  a2, 0                # result = 0

blt a0, a1, else_branch  # 如果 x < y,则跳转到 else_branch
add a2, a0, a1           # 否则执行 result = x + y
j end                    # 跳转到 end
else_branch:
sub a2, a0, a1           # result = x - y
end:

解读上述程序:在代码的前三行,指令顺序执行,但在程序的第 5 行,出现了一条特殊指令blt--分支指令,它会根据 x 和 y 的大小关系决定指令流顺序往下执行还是跳转到其他地方,该指令的出现导致程序的执行出现了分支。

1 RISC-V分支预测

RISC-V分支预测的基本类型:条件分支指令和无条件分支指令;

1.0 分支预测基本类型

1.0.1 条件分支指令

  • 条件分支指令:RISC-V中的条件分支指令(如beq、bne、blt、bge等)根据两个寄存器的值或一个寄存器与一个立即数的值进行比较,然后根据比较结果决定是否跳转。分支预测器需要根据历史信息和当前的条件来预测分支是否会被执行。
    对于条件分支指令,既需要预测方向(即分支是否会被执行),也需要预测目标地址(即如果分支被执行,程序将跳转到哪个地址)。在RISC-V架构中,条件分支指令如beq(Branch if Equal)、bne(Branch if Not Equal)、blt(Branch if Less Than)、bge(Branch if Greater Than or Equal)等都属于这一类。
    分支预测器需要根据历史信息和当前的指令流来预测条件分支指令的执行方向。如果预测分支会被执行,那么它还需要预测跳转的目标地址。这是因为即使分支条件满足,程序也可能跳转到不同的目标地址,具体取决于指令中的立即数或寄存器值。

1.0.2 无条件分支指令

  • 无条件分支指令:RISC-V中的无条件分支指令(如jal、jalr等)总是会执行跳转,目标地址由指令中的立即数或寄存器值指定。对于这类指令,分支预测器的任务相对简单,因为它们总是会执行跳转。
    无条件分支指令只需要预测目标地址。因为无条件分支指令总是会执行跳转,所以分支预测器的任务就是预测跳转的目标地址。在RISC-V架构中,无条件分支指令如jal(Jump and Link)和jalr(Jump and Link Register)就是这样的指令。
    对于jal指令,它会将下一条指令的地址加上一个立即数,然后跳转到这个计算出来的目标地址。分支预测器需要预测这个目标地址,以便提前获取指令。
    对于jalr指令,它会将一个寄存器的值加上一个立即数,然后跳转到这个计算出来的目标地址。分支预测器同样需要预测这个目标地址。
    从前篇也可以得到分支预测的两大任务:方向预测(taken or not taken) 和 目标地址预测;

对于条件分支指令,处理器会评估条件表达式,如果条件满足,PC值会更新为分支目标地址;如果条件不满足,PC值会增加,指向下一条顺序指令的地址。

对于无条件分支指令,处理器会直接将PC值更新为分支目标地址,而不考虑任何条件。

1.1 方向预测

常用的方向预测方法;

1.1.1 饱和计数器法

两bit饱和计数器法--一种简单且十分高效的预测方法;具体原理在上篇有展示,就不在这里赘述了;

为每一条分支指令都维护一个两位计数器是不现实的,实际中是通过采取PC部分位或哈希方法来索引两位计数器。

在这里PC值是对应的分支指令的程序计数器值----即当CPU执行到这个分支指令(即该分支指令对应的的PC值)。

1.1.1.1 Questions

Good Question: 那下次再次执行到这个分支指令时,这个分支指令对应的PC值是和上一次一样的,还是有变化了?

Answer: 当程序再次执行到同一个分支指令时,分支指令对应的程序计数器(PC)值通常是不同的。这是因为程序计数器(PC)在处理器中是一个不断递增的寄存器,它指向当前正在执行的指令的地址。每次执行一条指令后,PC 值都会增加,以便指向下一条指令的地址。

然而,分支指令的执行会改变 PC 值的递增方式。当处理器执行到一条分支指令时,它会根据分支指令的类型(如条件分支或无条件分支)和当前的条件状态(如寄存器的值或标志位)来决定是否跳转以及跳转到哪个地址。如果分支指令导致了跳转,PC 值会被更新为分支目标地址,而不是简单地增加。

因此,即使程序再次执行到同一个分支指令,PC 值也会根据分支指令的执行结果而变化。如果分支指令再次导致了跳转,PC 值将被更新为新的分支目标地址;如果分支指令没有跳转,PC 值将继续按照顺序执行的方式递增。

Good Question:那既然该分支指令即使下次再执行到时,它的PC值依然会增加变化,那如何通过取它的PC的部分位来进行索引呢?

Answer: 尽管PC值在每次执行指令后都会增加,但分支指令的地址相对于当前PC值的偏移量通常是固定的。因此,可以通过取PC值的一部分来构建索引,以便在BHT中查找对应的分支预测信息。

尽管PC值在每次执行指令后都会增加,但分支指令的地址相对于当前PC值的偏移量通常是固定的。因此,可以通过取PC值的一部分来构建索引,以便在BHT中查找对应的分支预测信息。

1.1.2 分支历史法--程序局部性原理

程序的局部性原理--即程序在一段时间内的执行行为往往具有一定的规律性。通过分析分支指令的历史执行情况,处理器可以对未来的分支行为做出较为准确的预测,从而提高指令流水线的效率。

分支历史有两种基本类型:局部分支历史和全局分支历史;

  • 局部分支历史:为每一条分支指令维护一组寄存器,记录该条指令的历史跳转情况
    例如: 0101000000101 (0代表不跳转,1代表跳转)
  • 全局分支历史:所有指令共用一组寄存器,记录程序执行过程中的分支跳转情况
    例如:

    执行完三条不同的分支指令后,全局分支历史变为 001;
1.1.2.1 Questions

Good Quetion:那既然是全局历史寄存器来存储程序指令的执行情况,那为什么还需要一组而不是只需要单个呢?

Answer: 最起码有以下三点考量:

  • 历史深度:程序的执行过程中可能会有大量的分支指令,使用一组寄存器可以提供更长的历史深度,从而更好地预测未来的分支行为。如果只使用一个寄存器,那么它只能记录最近的一次分支情况,这对于复杂的程序来说可能是不够的。
  • 并行处理:现代处理器通常具有多个执行单元,可以同时执行多条指令。使用一组寄存器可以允许处理器同时处理多个分支指令的预测,提高并行处理的效率。
  • 预测准确性:分支预测的准确性通常与可用的历史信息的数量和质量有关。使用一组寄存器可以提供更多的历史信息,从而可能提高预测的准确性。

1.2 目标地址预测

1.2.1 分支目标缓存--BTB

BTB分支目标缓存--使用一个缓存来存储以往无条件跳转指令的跳转目标,之后如果再次执行到这一条无条件跳转指令,就可以查看BTB中是存在该指令的记录,将记录的跳转目标作为本次预测的跳转目标。

示意图如下:

如何理解这个图:待确定补充?

1.3 预测指令类型

背景问题:拿到一个PC,我们并不清楚这个PC所对应的指令是什么,即我们根本不知道当前指令到底是一条普通指令还是一条分支指令,也就无法进行预测了。

1.3.1 直接预测指令类型

一种方法是,直接预测指令的类型,拿到一个PC之后,可以直接预测出这条指令是否是分支指令,并对指令行为进行预测。这样一来,我们就没有必要等待取指完成,并且预测出来的结果还可以指导 CPU 到什么地方去取指。

类型预测的方法,可以与BTB相似,在缓存中的某个字段中加入指令的类型,以供下一次预测使用。

这样总结起来分支预测的一般步骤:

1.获取到PC;

2.预测是否是分支指令(即预测该指令类型):

a.如果是条件分支指令,预测其跳转方向和跳转目标

b.如果是无条件跳转指令 ,预测其跳转目标

[Ref]

https://open-verify.cc/xs-bpu/docs/basic/00_bp/