ThreeWayBranch 优化阅读笔记

1. 优化目的

通过重排三分支的 BB 块减少比较指令的执行次数

代码路径:

bash 复制代码
bolt/lib/Passes/ThreeWayBranch.cpp

2. 效果

优化前:
注: 黄色数字表示BB块编号, 紫色表示该分支跳转的次数,绿色是代码里BB块的变量名

ThreeWayBranch 优化后:

注: BB块1.5 会在后面的优化删除

ThreeWayBranch + reorder-block 优化后:

测试用例:

bolt/test/runtime/X86/three-way-branch-pass.s

asm 复制代码
    .text
    .globl main
    .type main, %function
    .size main, .Lend-main
main:
    mov $0x0, %eax
    cmp $0x1, %eax
    jge .BB1
    mov $0xf, %eax
    xor %eax, %eax
    retq
.BB1:
    jg .BB2
    retq
.BB2:
    mov $0x7, %eax
    retq
.Lend:

遗留问题:

优化后的 BB 5 跳转变成 fallthrough 性能会更好吗 ?

相关推荐
猪哥帅过吴彦祖1 天前
从源码到可执行文件:揭秘程序编译与执行的底层魔法
操作系统·编译原理·编译器
黑客思维者15 天前
编译器工作原理的显微镜级拆解
编译器·工作原理
SixHateSeven1 个月前
🚀 TSX动态编译的黑科技,快如闪电!
前端·编译器
矮油0_o2 个月前
第一部分 -- ①语法分析的概要
java·编译器·解释器·语法分析
Jooolin2 个月前
【编程史】IDE 是谁发明的?从 punch cards 到 VS Code
ai编程·visual studio code·编译器
huangyuchi.2 个月前
【Linux】编译器gcc/g++及其库的详细介绍
linux·运维·服务器·笔记·编译器·gcc·g++
胡乱儿起个名3 个月前
Relay算子注册(在pytorch.py端调用)
c++·人工智能·tvm·编译器·ai编译器
胡乱儿起个名3 个月前
PrimExpr 与 RelayExpr 的区别
人工智能·tvm·编译器·ai编译器
胡乱儿起个名4 个月前
Relay IR的核心数据结构
人工智能·tvm·编译器·ai编译器
航哥4 个月前
Go语言编译器的正确打开方式(二)- 通过Debug理解Go的编译过程
go·编译器