超标量处理器设计笔记(9) 重命名映射表、超标量处理器重命名中相关性问题

寄存器重命名

  • 重命名映射表
    • [基于 SRAM 的重命名映射表](#基于 SRAM 的重命名映射表)
  • 超标量处理器的寄存器重命名
    • [解决 RAW 相关性](#解决 RAW 相关性)
    • [解决 WAW 相关性](#解决 WAW 相关性)
      • [对写 RAT 进行检查(判断哪个 ARF 写入到 RAT)](#对写 RAT 进行检查(判断哪个 ARF 写入到 RAT))
      • [对写 ROB 进行检查(判断)](#对写 ROB 进行检查(判断))
    • 特殊指令处理方式

重命名映射表

重命名时

  • 源寄存器查找 RAT 获得对应物理寄存器标号
  • 指令的目的寄存器会新增对应新的物理寄存器

两种方式

  • SRAM 方式
    • SRAM 是每个逻辑寄存器分配一个物理寄存器
    • Entry 项为 32 个,一共有 32 个逻辑寄存器
    • SRAT 占据空间是 32 X 6 bits = 192 bits
  • CAM 方式(Content Addressable Memory)
    • CAM 是每个物理寄存器分配一个逻辑寄存器,所以需要 valid 位来表示
    • Entry 项为 64 个,一共有 64 个物理寄存器
    • CRAT 占用空间是 64 X 5 bits = 320 bits
    • 需要 valid 位来表示
  • 对比
    • 都是使用逻辑寄存器来寻址
    • SRAM 快,并且节省资源
    • 对 cRAT 进行 Checkpoint 只需要保存状态位

32 个逻辑寄存器 5 位来表示

64 个物理寄存器 6 位来表示

#问题 CAM 的 check points 只需要一位?

在完成 RAT 写入时

对于一个特点的通用寄存器来说

  • SRAM 中
    • 需要保存当前值,当前值又因为 ARF 可能会不断映射新的值而被覆盖,所以需要保存所有
  • CAM 中
    • ARF 的内容不断写入,PRF 不断新增覆盖旧项,所以只需要指示 valid 即可

基于 SRAM 的重命名映射表

超标量处理器的寄存器重命名

Dest = Src1 op Src2

过程

  • 从 RAT 里找到 Src1 和 Src2 的物理寄存器 Psrc1 和 Psrc2
  • 从 free list 中找到一个空闲的物理寄存器 Pdest
  • 将 Dest 和 Pdest 的映射关系写到 RAT 中,之后可以用 Dest 去索引映射关系

一条指令重命名,RAT 一共需要 3 读 1 写端口

  • 3 读
    • 2 个 Src1 和 Src2
    • 1 个 Dest 读取之前的映射
  • 1 写
    • 给 Dest 写入新的映射

4-way 指令则是 12 读,4 写

重命名可以解决 WAR 和 WAW 问题

为什么重命名还需要 RAW 和 WAW 相关检查

  • 指令 A 和 B 之间 RAW 相关
    • R0 需要查询指令 A 的结果,而不是 RAT 的结果
  • 指令 A、B、D 之间 WAW 相关
    • 写入 RAT 时,一个周期多条指令有相同目的寄存器,则将最新的映射写到 RAT 中即可
    • 而检查旧映射时,也应该使用有 WAW 相关性的指令,而不是 RAT 读取的值
  • 指令 B 和 D 之间的 WAR 相关
    • 对重命名没有影响

主要延迟的来源:

  • 多端口 SRAM 本身延迟
  • RAW 和 WAW 相关性检查的延迟

在不出现 RAW 和 WAW 相关下的映射

解决 RAW 相关性

#问题 R1 映射出来结果应该一致,为什么会不一致?

检查方式:

  • 每条指令的 Src 和之前的 Dst 编号进行比较,如过相等,则用 free list 取出来的值,如果有多个相等,则取出最新的指令对应的物理寄存器

解决 WAW 相关性

对写 RAT 进行检查(判断哪个 ARF 写入到 RAT)

只有最新的指令 D 才能写到 RAT,对周期内进行寄存器重命名的所有 WAW

写之前完成检查

对写 ROB 进行检查(判断)

为了释放不再使用的物理寄存器,需要从 RAT 读出以前对应的物理寄存器,并且写到 ROB 当中,告诉 ROB 我的值是在哪里,而不是让 ROB 去检查 ART 查到错误的值

如果寄存器地址,同时读写操作,先读后写

  • 读优先则能满足需求

FPGA 的两种特性

写优先

  • 写入的内容可以马上读取到

读优先

  • 写入的内容需要在下个周期读取

特殊指令处理方式

  • 根据当前目的寄存器的个数,决定当前周期从 free list 中读取的数值的个数
  • 使用目的寄存器读取 RAT 时,根据标记,明确哪些会读哪些不会读
  • 使用源寄存器读取 RAT 时,通用
  • RAW 和 WAW 检查时自动忽略比较的结果
相关推荐
特种加菲猫2 小时前
指尖上的魔法:优雅高效的Linux命令手册
linux·笔记
wuxuanok2 小时前
Web后端开发-分层解耦
java·笔记·后端·学习
wuxuanok3 小时前
Web后端开发-请求响应
java·开发语言·笔记·学习
诗句藏于尽头4 小时前
内网使用rustdesk搭建远程桌面详细版
笔记
蜡笔小电芯4 小时前
【C语言】指针与回调机制学习笔记
c语言·笔记·学习
丰锋ff4 小时前
瑞斯拜考研词汇课笔记
笔记
DKPT6 小时前
Java享元模式实现方式与应用场景分析
java·笔记·学习·设计模式·享元模式
KoiHeng8 小时前
操作系统简要知识
linux·笔记
巴伦是只猫10 小时前
【机器学习笔记Ⅰ】11 多项式回归
笔记·机器学习·回归
DKPT13 小时前
Java桥接模式实现方式与测试方法
java·笔记·学习·设计模式·桥接模式