C/C++源代码经过 GCC 解析(Parse)及转换后,通过 GIMPLE IR 予以表示(Representation)。其中,一个C/C++源文件,通过 宏处理后,形成一个 转译单元(Translation Unit),在 GCC 内部,通过下面结构予以表示:
Symbol Table
-- Global Variables
-- Call Graph
-- Functions
-- Control Flow Graph
-- Basic Blocks
-- instructions
-- defintions and uses
上述表达,可以清楚地看到程序的控制流走向。在最末端的指令层级(Instructions),GIMPLE IR 指令 或 RTL IR 指令,一般表达为三地址模式的操作(3 - Addresses operations),即
Op result, src0, src1
那么,对于不同的指令,抽象来看,都会有其 定义的值/变量(Definitions),以及有其 使用的值或变量(Uses),如上面的,result 为 其定义(defintion),src0, src1为其使用(use)。
在 GIMPLE IR 和 RTL IR 中,会通过 指令的编号来作为其使用(use)的引用。
那么,通过对指令的定义及使用的分析,逐步往上,扩展到 基础块(Basic Block),控制流图(Control Flow Graph)等,实现程序的数据流分析(Data-Flow Analysis)。
例如,将GIMPLE IR 转换成 SSA(Static Single Assignment)的模式,使得每个值对应唯一的变量,这样就简化了数据流的分析。然后,基于SSA,就可以实现 constant propagation 等优化。
又例如,Domination Tree 的构建,Live-variable 等。都是基于上述的框架,通过分析指令的定义与使用,得出数据流(Data-Flow / Value-Flow)的信息。