AI 编译器系列（七）《(MLIR)AscendNPU IR 编译堆栈》

[AscendNPU IR 架构概述](#AscendNPU IR 架构概述)

[Triton-Ascend + AscendNPU IR](#Triton-Ascend + AscendNPU IR)

[MLIR 简介：](#MLIR 简介：)

[1. 定义：](#1. 定义：)

[2. 特点：](#2. 特点：)

[AscendNPU IR 引入：](#AscendNPU IR 引入：)

[AscendNPU IR 架构详解](#AscendNPU IR 架构详解)

[HFusion 方言关键 Pass](#HFusion 方言关键 Pass)

[HFusion 方言 OP 设计](#HFusion 方言 OP 设计)

[HFusion 预处理层](#HFusion 预处理层)

[HIVM 方言关键 Pass](#HIVM 方言关键 Pass)

[HIVM OP 设计原则](#HIVM OP 设计原则)

[HIVM OP 属性设计](#HIVM OP 属性设计)

[HIVM OP Interface 设计](#HIVM OP Interface 设计)

[HIVM CV 融合编译优化](#HIVM CV 融合编译优化)

[HIVM 片上内存映射](#HIVM 片上内存映射)

[调优选项及 Hint](#调优选项及 Hint)

[细粒度调优 Compiler hint](#细粒度调优 Compiler hint)

本文主要讲解 AscendNPU IR 架构。

AscendNPU IR 架构概述

• MLIR（Multi-Level Intermediate Representation）是一种开源的编译基础设施，旨在通过统一且可扩展的中间表示解决软件碎片化和编译效率问题。

• AscendNPU IR 采用多层方言设计，主要包括 Hfusion 和 HIVM 两层核心方言，辅以Annotation、HACC、Scope等辅助方言。

• 从前端 DSL 到 Triton IR，再到 TritonGPU IR（或 MLIR 公共方言如 Linalg），最终转换为AscendNPU IR，并编译成二进制文件。

• Hfusion：
- • 设计原理： 基于 Linalg 的扩展，采用命名 OP 保留高层语义信息。
- • 功能： 数据预处理、OP 简化、类型转换等，不直接涉及硬件细节。
- • 优化： 合法性检查、冗余操作消除、高层 OP 分解等。
• HIVM：
- • 设计原则： 轻量化抽象硬件表达能力，每个 OP 处理一个单元操作。
- • 功能： 支持硬件特定操作，如 Cube 类算子的快速构建，通过 Microop 封装复杂操作。
- • 优化： 内存分配、指令映射、流水并行等。