GE 引擎的内存优化终局：静态生命周期分析指导下的内存分配与复用策略

CANN 组织链接 ： https://atomgit.com/cann
GE 仓库链接 ： https://gitcode.com/cann/ge

GE 在图编译阶段执行的内存生命周期分析，是决定最终设备内存占用（HBM）的关键。

GE 对图中每个张量进行分类：

基于生命周期图，GE 采用图遍历算法，识别出生命周期不相交的中间张量，并将它们合并到同一个 HBM 内存块中，从而实现内存复用。

在训练模式下，GE 必须处理前向传播、反向传播（梯度计算）和参数更新所需的内存空间。

训练模式下，前向传播的中间激活值需要被缓存（Checkpointing）供反向传播使用。GE 需要智能地安排前向计算 与反向计算的顺序，以最大限度地复用内存。

GE 生成的执行计划不仅包括算子执行顺序，还包括内存分配/释放操作的触发点。

静态分配/释放注入：在图编译输出的指令流中，GE 注入了在 Runtime 执行前必须完成的内存预分配指令，以及在特定算子执行完成后立即标记内存可复用的指令。这确保了 Runtime 知道何时可以安全地回收内存，避免了 GC 延迟。

GE 在内存优化方面的作用是全局性的、静态的。它通过对整个计算图的生命周期进行精确建模和分析，实现了设备内存资源的极致利用。这种静态的、基于图的内存规划，是保障大规模模型在有限 HBM 资源上稳定运行的关键技术。

CANN 组织链接 ： https://atomgit.com/cann
GE 仓库链接 ： https://gitcode.com/cann/ge