mlir 编译器学习笔记之四 -- 调度

1、指令的活跃区间 LiveRange [startTime, endTime]

startTime: 节点开始执行的时间(指令被发射到功能单元)

endTime: 节点结果就绪的时间(指令执行完成,结果可用)

前驱指令P: R1 = R2 + R3 // LiveRange: [10, 12]

当前指令C: R4 = R1 * 2 // 什么时候可以开始?==> R1 就绪,即endTime

2、普通调度 (严格顺序)& 硬件循环(允许重叠)的原因

复制代码
T1 = max(preStart + hardware_switch_overhead,preEnd + loop_iteration_period - latency)

普通调度OOO:可以提前发射,但会在流水线中等待

硬件循环:可以更早开始执行,因为有数据转发 (专有硬件,不竞争通用资源)

3、资源占用:级联模式时需要多个功能单元

相关推荐
执笔论英雄1 天前
【大模型学习cuda】入们第一个例子-向量和
学习
wdfk_prog1 天前
[Linux]学习笔记系列 -- [drivers][input]input
linux·笔记·学习
ouliten1 天前
cuda编程笔记(36)-- 应用Tensor Core加速矩阵乘法
笔记·cuda
孞㐑¥1 天前
算法——BFS
开发语言·c++·经验分享·笔记·算法
Gary Studio1 天前
rk芯片驱动编写
linux·学习
mango_mangojuice1 天前
Linux学习笔记(make/Makefile)1.23
java·linux·前端·笔记·学习
工程师老罗1 天前
YOLOv1 核心知识点笔记
笔记·yolo
lingggggaaaa1 天前
安全工具篇&动态绕过&DumpLsass凭据&Certutil下载&变异替换&打乱源头特征
学习·安全·web安全·免杀对抗
PP东1 天前
Flowable学习(二)——Flowable概念学习
java·后端·学习·flowable
学电子她就能回来吗1 天前
深度学习速成:损失函数与反向传播
人工智能·深度学习·学习·计算机视觉·github