onnx的基本介绍

TensorRT 从框架中导入训练模型的主要方式是通过ONNX交换格式。 TensorRT 附带一个 ONNX 解析

器库来帮助导入模型。在可能的情况下,解析器向后兼容 opset 7; ONNX模型 Opset 版本转换器可以帮助解决不兼容问题。
GitHub 版本可能支持比 TensorRT 附带的版本更高的 opset,请参阅 ONNX-TensorRT运算符支持矩阵运算符支持矩阵,以获取有关受支持的 opset 和运算符的最新信息。

TensorRT 的 ONNX 算子支持列表可在此处找到。

PyTorch 原生支持ONNX 导出。对于 TensorFlow,推荐的方法是 tf2onnx

将模型导出到 ONNX 后的第一步是使用Polygraphy运行常量折叠。这通常可以解决 ONNX 解析器中的TensorRT 转换问题,并且通常可以简化工作流程。有关详细信息,请参阅此示例。在某些情况下,可能需要进一步修改 ONNX 模型,例如,用插件替换子图或根据其他操作重新实现不受支持的操作。为了简化此过程,您可以使用ONNX-GraphSurgeon

相关推荐
李李李li1 个月前
Ubuntu 22.04 安装tensorrt
linux·tensorrt
爱分享的飘哥1 个月前
第六十一章:AI 模型的“视频加速术”:Wan视频扩散模型优化
人工智能·剪枝·tensorrt·量化·模型优化·视频扩散模型·cuda graph
楚潸潸1 个月前
从onnx模型到om模型的全自动化转化
深度学习·边缘计算·onnx·昇腾·om模型
谢白羽1 个月前
tensorRT配合triton部署模型
yolo·tensorrt·onnx·triton
一包烟电脑面前做一天2 个月前
.Net + Qdrant 使用Microsoft.ML.OnnxRuntime调用本地大模型实现文本向量化,实现简单RAG
.net·onnx·rag·文本向量化·本地大模型·qdrant
AlfredZhao3 个月前
曾经风光无限的 Oracle DBA 已经落伍了吗?
ai·vector·embedding·onnx·hnsw·ivf
kcarly5 个月前
TensorRT 有什么特殊之处
ai·ai绘画·nvidia·tensorrt
鹅毛在路上了6 个月前
视频结构化框架VideoPipe-OpenCV::DNN-TensorRT安装教程【Nvidia各系列显卡-亲测有效】
opencv·音视频·tensorrt
搬砖的阿wei6 个月前
TensorRT:高性能深度学习推理的利器
人工智能·深度学习·tensorrt
搬砖的阿wei6 个月前
ONNX:统一深度学习工作流的关键枢纽
人工智能·python·深度学习·onnx