算法学习-2024.8.16

蓝纹绿茶2024-08-16 14:55

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时，通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度，达到加速推断的目的 。

TensorRT对于网络结构进行了重构，把一些能够合并的运算合并在了一起，针对GPU的特性做了优化。

一个深度学习模型，在没有优化的情况下，比如一个卷积层、一个偏置层和一个reload层，这三层是需要调用三次cuDNN对应的API，但实际上这三层的实现完全是可以合并到一起的，TensorRT会对一些可以合并网络进行合并。

上一篇：Flowise在ubuntu22.04上的安装

下一篇：数据结构——栈

热门推荐

01MIUI显示/隐藏5G开关的方法，信号弱时开启手机Wifi通话方法 02Coze实战第13讲：飞书多维表格读取+豆包生图模型，轻松批量生成短剧封面 03Coze扣子平台完整体验和实践（附国内和国际版对比）042024年最新 iPhone手机历代机型、屏幕尺寸、纵横比、分辨率整理 05手机电脑之间快速传输图片视频文件，不压缩画质、不限制大小的方法！06扣子（coze）实战|我用扣子搭建了一个自动分析小红薯笔记内容的AI应用|详细步骤拆解 07扣子空间的使用教程与大模型技术思考 08华为昇腾 910B 部署 DeepSeek-R1 蒸馏系列模型详细指南 09DeepSeek各版本说明与优缺点分析 10GPU 进阶笔记（二）：华为昇腾 910B GPU