pytorch 源码阅读(2)——torch._dynamo.optimize

0 torch._dynamo.optimize(backend, *, nopython, guard_export_fn, guard_fail_fn, disable, dynamic),TorchDynamo 的主入口点

1 参数说明

  • backend,一般有两种情况:
    • 一个包含 torch.fx.GraphModule 和 example_inputs,返回一个能够更快执行 graph 的函数或者可调用的对象。也可以通过设置backend_ctx_ctor 属性,来给后端提供额外的上下文。具体用法可以查看AOTAutogradMemoryEfficientFusionWithContext
    • 或者是一个torch._dynamo.list_backends()里面的字符串后端名称。
  • nopython: 如果时 True,graph breaks 将会报错,并且只有一个完整的 graph
  • disable:如果为 True,设置当前装饰器为 no-op
  • dynamic:(bool or None): 使用动态 shape 进行 tracing
    • True:尝试生成尽可能动态的 kernel,但这个也不总是有效的,因为某些特化优化会使动态 kernel 失效
    • False:将不生成任何动态的 kernel,只进行特化优化
    • None:默认值,会自动检测是否发生了动态变化,并在重新编译时编译一个更动态的动态内核。

2 额外说明

这个函数时 TorchDynamo 的主入口点。 进行 graph 提取并调用 backend() 来优化提取到的 graph。

相关推荐
王木风7 小时前
Spring Boot + LLM 工程化:把短视频流水线拆成 16 个独立角色的踩坑记录
人工智能·spring boot·后端·开源·新媒体运营·音视频·agent
信实翻译7 小时前
分账模式翻译:跨越商业与语言的精密计算
人工智能
EAIReport7 小时前
企业级AI智能体平台说明
人工智能
智海观潮7 小时前
UniScientist:30B开源科研大模型突破,重构AI自主研究范式
人工智能·ai·大模型
chen_zn957 小时前
VLA 的 Co-training:通过多源数据提升机器人泛化能力
人工智能·深度学习·具身智能·vla
AI客栈7 小时前
K8s 调度器扩展:从 Scheduling Framework 到自定义插件的工程实战
人工智能
大模型最新论文速读8 小时前
06-15 · LLM 最新论文速览
论文阅读·人工智能·深度学习·自然语言处理
城事漫游Molly8 小时前
如何用 ChatGPT 辅助写文献综述,而不是编造文献?
人工智能·chatgpt·提示词·ai for science·文献综述
-山中问答-8 小时前
【智能体工具使用实战06】工具增强型Agent的评测体系
人工智能·智能体·工具调用·测评体系
_codemonster8 小时前
手语识别损失函数
人工智能·深度学习·机器学习