ai编译器

胡乱儿起个名1 个月前
c++·人工智能·tvm·编译器·ai编译器
Relay算子注册(在pytorch.py端调用)路径: src/relay/op/nn/nn.cc路径: src/relay/op/nn/activation.cc
胡乱儿起个名1 个月前
人工智能·tvm·编译器·ai编译器
PrimExpr 与 RelayExpr 的区别在 TVM 的表达式系统中,PrimExpr 和 RelayExpr 是两种不同层级的表达式类型,分别服务于 TVM 的不同编译阶段和目标场景。以下是它们的核心区别和关联:
胡乱儿起个名2 个月前
人工智能·tvm·编译器·ai编译器
Relay IR的核心数据结构在 Apache TVM 的 Relay IR 中,基础节点(Var、Const、Call、Function 和 Expr)是构建计算图的核心数据结构。以下是对它们的详细解析,包括定义、作用、内部组成及相互关系:
胡乱儿起个名2 个月前
人工智能·tvm·ai编译器
《Relay IR的基石:expr.h 中的表达式类型系统剖析》在TVM的Relay IR中,即使是看似简单的常量表达式relay.const(1),其背后也隐藏着整个类型系统的精妙设计。让我们从include/tvm/relay/expr.h中的Constant类入手,逐步拆解…"
哦豁灬1 年前
学习·ai编译器·iree
iree 编译流程(1)IREE 目前支持将 MHLO 或 XLA、Torch Tensor 和 TOSA 作为输入,经过一系列 passes 编译生成 IREE 定义的 VM bytecode 中间产物,其中硬件相关代码会编译成相应的 Executable,保存在 VM bytecode 中供 host 进行调用。例如 CUDA 相关的计算代码会被lower 成 PTX 代码,在 IREE 的 runtime 中再被 CUDA 的 runtime 以 JIT 的方式编译成可执行的 cubin kernel。
Briwisdom1 年前
人工智能·tvm·算子·ai编译器·指令优化
AI编译器的后端优化策略工作领域是AI芯片工具链相关,很多相关知识的概念都是跟着项目成长建立起来,但是比较整个技术体系在脑海中都不太系统,比如项目参与中涉及到了很多AI编译器开发相关内容,东西比较零碎,工作中也没有太多时间去做复盘与查漏补缺。但是最近比较闲,发现了一个宝藏级的B站博主,系统的讲了很多AI芯片领域的知识,并把课程资源开源维护,极力推荐大家多多关注。在这里当个搬运工,传播一下。