在jetson thor上高效部署π0.5和yolo模型

在thor上部署π0.5

有2种方法:

  1. 直接使用pytorch + torch.compile
  2. 使用pytorch + tensorrt engine

其中方法2的难点是如何将tensorrt engine与pytorch流程结合起来,

如使用pytorch + action DIT engine或者使用pytorch + llm tensorrt engine + action DIT engine

基本思路是将tensorrt engine调用封装成forward方法并动态替换pytorch实现,这样可以灵活地替换我们想优化性能的部分。再保持高灵活性的同时兼顾推理性能。

具体细节有个生产级的开源项目, 已经完成了量化,编译,部署。十分值得学习和参考:
https://github.com/happyAnger66-an/model_optimizer

相关推荐
【赫兹威客】浩哥9 小时前
无人机视角军事目标细分类检测数据集及多YOLO版本训练验证
yolo·分类·无人机
彭祥.18 小时前
YOLO-seg训练LoveDa数据集
yolo
BestSongC19 小时前
行人摔倒检测系统 - 后端文档(1)
vue.js·人工智能·yolo·目标检测·fastapi
查无此人byebye19 小时前
从DDPM到DiT:扩散模型3大核心架构演进|CNN到Transformer的AIGC生成革命(附实操要点)
人工智能·pytorch·深度学习·架构·cnn·音视频·transformer
love530love21 小时前
突破 Windows 编译禁区:BitNet 1-bit LLM 推理框架 GPU 加速部署编译 BitNet CUDA 算子全记录
c++·人工智能·pytorch·windows·python·cuda·bitnet
紫金修道21 小时前
【Yolov5】基于瑞芯微RK3588 python-api的推理模块
开发语言·python·yolo
苏三福21 小时前
yolo11-seg模型后处理输出节点
yolo·ai
BestSongC21 小时前
行人摔倒检测系统 - 后端文档(2)
前端·javascript·vue.js·yolo·目标检测
豆浩宇1 天前
无监督Anomalib 2.2.0算法Top7 介绍
开发语言·c++·算法·yolo·计算机视觉
盼小辉丶1 天前
PyTorch实战(28)——PyTorch深度学习模型部署
人工智能·pytorch·深度学习·模型部署