技术栈
ge
嗝o゚
17 天前
算法
·
昇腾
·
cann
·
ge
CANN GE 算子融合——融合算法与调度策略
GE 的算子融合是性能提升的核心手段。哪些算子能融合、融合的边界在哪里、调度顺序怎么定,这些都影响最终的执行效率。
hh.h.
23 天前
架构
·
cann
·
ge
昇腾CANN ge 仓:图引擎的架构与实战
训练大模型的时候,计算图要跑到昇腾NPU上,中间要经过一层转换——从 PyTorch/TensorFlow 的计算图转换成昇腾的图格式。ge(Graph Engine)就是干这个的,它是 CANN 的图编译和运行时引擎,位于第三层(昇腾计算编译层)。这篇文章拆开看 ge 的架构,以及怎么用它做图优化。
我是有底线的