算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
sbc-study19 小时前
comsol例题学习-旋转晶片电镀-稀物质传递+二次电流分布+电极,壳+层流
学习·comsol·二次电流分布·稀物质传递·电极,壳·多物理场耦合·层流
智算菩萨19 小时前
【Python基础】AI的“重复学习”:循环语句(for, while)的奥秘
人工智能·python·学习
stars-he19 小时前
二极管峰值包络检波电路仿真学习笔记
笔记·学习
炽烈小老头19 小时前
【每天学习一点算法 2025/12/25】爬楼梯
学习·算法·动态规划
songyuc20 小时前
VCD学习笔记
学习
xiaoxiaoxiaolll20 小时前
偏振调控新维度!《Advanced Science》梯度下降算法赋能超表面实现24通道3D全息
学习
思成不止于此20 小时前
【MySQL 零基础入门】事务精讲(三):隔离级别与实战总结
数据库·笔记·学习·mysql
小智RE0-走在路上20 小时前
Python学习笔记(12) --对象,类的成员方法,构造方法,其他内置方法,封装,继承,多态,类型注解
笔记·python·学习
先生沉默先20 小时前
c#Socket学习,使用Socket创建一个在线聊天,日志笔记(5)
笔记·学习·c#
崇山峻岭之间21 小时前
Matlab学习记录14
开发语言·学习·matlab