onnx

从onnx模型到om模型的全自动化转化项目位置：https://github.com/whypoxic/Ascend-ATC-tool_onnx2om

tensorRT配合triton部署模型initializer：拓扑关系：先conv，后relu3.1 边 3.2 算子 3.3 模型 3.4 图

一包烟电脑面前做一天

.Net + Qdrant 使用Microsoft.ML.OnnxRuntime调用本地大模型实现文本向量化，实现简单RAG本文使用.Net + 向量数据库Qdrant，实现使用本地大模型（Onnx）实现简单RAG，代码仅实现基本演示功能。

曾经风光无限的 Oracle DBA 已经落伍了吗？先讲一个残酷的事实，Oracle DBA，若仍停留在纯粹的运维方向，未来的路将会越走越窄，尤其是在国内的特殊环境下，可以说是前途渺茫，举步维艰。

搬砖的阿wei

ONNX：统一深度学习工作流的关键枢纽在深度学习领域，模型创建与部署的割裂曾是核心挑战。不同框架训练的模型难以在多样环境部署，而 ONNX（Open Neural Network Exchange）作为开放式神经网络交换格式，搭建起从模型创建到部署的统一桥梁，完美诠释 “连接创造与部署” 的核心价值。

Yongqiang Cheng

Llama 2 Powered By ONNXhttps://github.com/microsoft/Llama-2-OnnxLlama 2 is a collection of pretrained and fine-tuned generative text models.

RK3588-NPU pytorch-image-models 模型编译测试

后端常规开发人员

最好用的图文识别OCR -- PaddleOCR(2) 提高推理效率(PPOCR模型转ONNX模型进行推理)在实际推理过程中，使用 PaddleOCR 模型时效率较慢，经测试每张图片的检测与识别平均耗时超过 5 秒，这在需要大规模自动化处理的场景中无法满足需求。为此，我尝试将 PaddleOCR 模型转换为 ONNX 格式进行推理，以提升效率。以下是模型转换与使用的完整过程记录。

Windows 使用 Intel(R) Arc(TM) GPU 推理ONNX 模型这不刚换了一个笔记本电脑，Thinkpad T14P，带有Intel ARC GPU，今天我们来尝试用这个GPU来推理ONNX模型。

Ubuntu20.04 更新Nvidia驱动 + 安装CUDA12.1 + cudnn8.9.7最近客户给了几台GPU服务器，长期放置落灰那种，然后想利用起来，所以上去看看了配置，系统是Ubuntu20.04，相关的驱动版本稍嫌老一些，所以需要更新Nvidia驱动，同时在安装CUDA和CUDNN，查看了显卡型号之后，打算使用onnxruntime进行推理，对比了版本，最后选择了CUDA12.1 + CUDNN8.9.7。

解决低版本pytorch和onnx组合时torch.atan2()不被onnx支持的问题解决这个问题，最简单的当然是升级pytorch和onnx到比较高的版本，例如有人验证过的组合: pytorch=2.1.1+cu118, onnxruntime=1.16.3

牙牙要健康

【深度学习】【图像分类】【OnnxRuntime】【Python】VggNet模型部署提示:博主取舍了很多大佬的博文并亲测有效,分享笔记邀大家共同学习讨论本期将讲解深度学习图像分类网络VggNet模型的部署，对于该算法的基础知识，可以参考博主【VggNet模型算法Pytorch版本详解】博文。读者可以通过学习【onnx部署】部署系列学习文章目录的onnxruntime系统学习–Python篇的内容，系统的学习OnnxRuntime部署不同任务的onnx模型。

yolact导出onnxgithub上有yolact-onnx仓库可以导出不带有nms和两个分支的矩阵相乘的部分，但是无法导出带有nms的部分。

搭建自己的AI模型应用网站：JavaScript + Flask-Python + ONNX本文作者以一个前端新手视角，部署自己的神经网络模型作为后端，搭建自己的网站实现应用的实战经历。目前实现的网页应用有：

导出 Whisper 模型到 ONNX在语音识别领域，Whisper 模型因其出色的性能和灵活性备受关注。为了在更多平台和环境中部署 Whisper 模型，导出为 ONNX 格式是一个有效的途径。ONNX（Open Neural Network Exchange）是一个开放格式，支持不同的深度学习框架之间的模型互操作性。本指南将详细介绍如何将 Whisper 模型导出为 ONNX 格式，并提供测试模型的步骤。

爱听歌的周童鞋

三. TensorRT基础入门-剖析ONNX架构并理解ProtoBuf自动驾驶之心推出的《CUDA与TensorRT部署实战课程》，链接。记录下个人学习笔记，仅供自己参考

阿里开源黑白图片上色算法DDColor的部署与测试并将模型转onnx后用c++推理DDColor是一种基于深度学习的图像上色技术，它利用卷积神经网络（CNN）对黑白图像进行上色处理。该模型通常包含一个编码器和一个解码器，编码器提取图像的特征，解码器则根据这些特征生成颜色。DDColor模型能够处理多种类型的图像，并生成自然且逼真的颜色效果。它在图像编辑、电影后期制作以及历史照片修复等领域有广泛的应用。

太阳花的小绿豆

Pytorch导出FP16 ONNX模型一般Pytorch导出ONNX时默认都是用的FP32，但有时需要导出FP16的ONNX模型，这样在部署时能够方便的将计算以及IO改成FP16，并且ONNX文件体积也会更小。想导出FP16的ONNX模型也比较简单，一般情况下只需要在导出FP32 ONNX的基础上调用下model.half()将模型相关权重转为FP16，然后输入的Tensor也改成FP16即可，具体操作可参考如下示例代码。这里需要注意下，当前Pytorch要导出FP16的ONNX必须将模型以及输入Tensor的device设置成GPU，否则会

Pytorch转onnxpytorch 转 onnx 模型需要函数 torch.onnx.export。常用参数说明参数说明 ONNX算子文档 ONNX 算子的定义情况，都可以在官方的算子文档中查看这份文档中最重要的开头的这个算子变更表格。表格的第一列是算子名，第二列是该算子发生变动的算子集版本号，也就是我们之前在torch.onnx.export中提到的opset_version表示的算子集版本号。通过查看算子第一次发生变动的版本号，我们可以知道某个算子是从哪个版本开始支持的；通过查看某算子小于等于opset_version

onnx runtime文档学习1-介绍与架构网上充斥着ONNX runtime的简单科普，却没有一个系统介绍ONNX runtime的博客，因此本博客旨在基于官方文档进行翻译与进一步的解释。ONNX runtime的官方文档：https://onnxruntime.ai/docs/