AI 编译器系列(三)《PyTorch 中图优化》

目录

[PyTorch 基础介绍](#PyTorch 基础介绍)

动态计算图的优势与劣势

[PyTorch 中的图优化](#PyTorch 中的图优化)

[1. TorchScript](#1. TorchScript)

[2. torch.fx](#2. torch.fx)

[3. PyTorch 2.0 时代:torch.compile](#3. PyTorch 2.0 时代:torch.compile)

总结


本文主要讲解 PyTorch 核心设计理念与图优化技术体系演进。

PyTorch 基础介绍

动态计算图的优势与劣势

PyTorch 中的图优化

  • • 前端:在保持 Python 动态语义的前提下,对张量相关计算进行捕获与抽象,生成可优化的中间表示(IR)

  • • 后端:基于中间表示进行图级优化、调度与代码生成

1. TorchScript

  • • 介绍:通过torch.jit实现

  • • 两个接口:

    • torch.jit.trace

    • torch.jit.script

2. torch.fx

  • • 介绍:Python 层 IR 与图变换工具

  • • 技术亮点:

    • Symbolic Tracing:通过 Proxy 对象代替输入张量,记录所有张量运算的结构与路径。

    • fx IR :高度简洁,6 种核心指令,placeholderget_attrcall_functioncall_modulecall_methodoutput

  • Python 源到源转换

    • • IR 反向映射回 Python 源码

    • • 基于 FX Graph 修改模型结构,导出新的nn.Module代码

3. PyTorch 2.0 时代:torch.compile

  • • 介绍:统一编译接口,在尽量保留 Python 动态语义的前提下,通过图捕获与优化提升执行效率

  • • 组件与步骤:

    • TorchDynamo(前端) :解释器级 tracing 框架,在 Python 字节码层面捕获张量相关计算,生成受 guard 约束的 FX Graph

      • • 工作原理:拦截 Python 函数执行,记录张量相关 IR

      • • Guards 机制:监控变量类型与值,确保重用编译图

      • • Graph Break:子图划分,处理无法转换为静态图的部分

  • AOT Autograd:提前生成前向与反向联合计算图

    • • 工作流程:Dispatcher 机制拦截与重定义 Tensor 操作,切分正反向计算图
  • TorchInductor(后端):后端优化,生成高效可执行代码

    • • 工作流程:接受 FX Graph,进行算子融合、内存规划与调度优化,并生成高效的执行代码

    • • 示例:CUDA 设备上的 Triton 后端代码生成过程

总结

本文讲了 PyTorch 图优化技术体系的演进历程与核心特性。后续将讲解 AI 编译器中的后端优化。

相关推荐
Raink老师16 小时前
【AI面试临阵磨枪】Harness 的环境隔离(沙箱)如何设计?文件、网络、命令、权限四层隔离?
人工智能·ai 面试
人工智能AI技术17 小时前
Python 断言 assert 基础用法
人工智能
清水白石00817 小时前
Python 编程实战全景:从基础语法到插件架构、异步性能与工程最佳实践
开发语言·python·架构
我是发哥哈17 小时前
横向评测:五款主流AI培训课程效果与选型分析
人工智能
GetcharZp17 小时前
告别昂贵显卡!llama.cpp 终极指南:在你的电脑上满速运行大模型!
人工智能
AI木马人17 小时前
3.【Prompt工程实战】如何设计一个可复用的Prompt系统?(避免每次手写提示词)
linux·服务器·人工智能·深度学习·prompt
lwf00616417 小时前
导数学习日记
学习·算法·机器学习
Agent产品评测局17 小时前
临床前同源性反应种属筛选:利用AI Agent加速筛选的实操方案 —— 2026企业级智能体选型与技术落地指南
人工智能·ai·chatgpt
yaoxin52112317 小时前
390. Java IO API - WatchDir 示例
java·前端·python
qeen8718 小时前
【编程日记】现阶段总结
学习