在jetson thor上高效部署π0.5和yolo模型

在thor上部署π0.5

有2种方法:

  1. 直接使用pytorch + torch.compile
  2. 使用pytorch + tensorrt engine

其中方法2的难点是如何将tensorrt engine与pytorch流程结合起来,

如使用pytorch + action DIT engine或者使用pytorch + llm tensorrt engine + action DIT engine

基本思路是将tensorrt engine调用封装成forward方法并动态替换pytorch实现,这样可以灵活地替换我们想优化性能的部分。再保持高灵活性的同时兼顾推理性能。

具体细节有个生产级的开源项目, 已经完成了量化,编译,部署。十分值得学习和参考:
https://github.com/happyAnger66-an/model_optimizer

相关推荐
DeepLearningYolo28 分钟前
UNet架构训练输电线路、输电杆塔、水泥杆和输电线路木头杆塔的语义分割模型检测输电线路分割
pytorch·深度学习·yolo·目标检测
kishu_iOS&AI2 小时前
深度学习 —— Pytorch
人工智能·pytorch·深度学习
嵌入式吴彦祖3 小时前
yolov5 C++环境搭建
yolo
llm大模型算法工程师weng3 小时前
模型训练与知识蒸馏:从大模型到轻量级情绪分析系统
pytorch·深度学习·机器学习
mahtengdbb13 小时前
CGFM上下文引导特征融合改进YOLOv26多尺度检测精度
yolo·数学建模
郝学胜-神的一滴4 小时前
ReLU激活函数全解析:从原理到实战,解锁深度学习核心激活单元
人工智能·pytorch·python·深度学习·算法
Uopiasd1234oo5 小时前
Converse2D频域卷积上采样改进YOLOv26图像重建与细节恢复能力
人工智能·yolo·目标跟踪
DeepLearningYolo5 小时前
基于PyQt的YOLOv5+DeepSORT可视化界面,可实现目标跟踪、模型更换、结果保存和轨迹隐藏等功能。
yolo·目标跟踪·pyqt
xiaoyaohou115 小时前
033、部署优化(四):模型编译与TVM在边缘设备上的应用
yolo
xiaoyaohou116 小时前
031、部署优化(二):TensorRT引擎构建与INT8量化推理
yolo