算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
一口吃俩胖子3 分钟前
【脉宽调制DCDC功率变换学习笔记021】时域性能准则
笔记·学习
@杰克成1 小时前
Java学习30
java·开发语言·学习
三品吉他手会点灯2 小时前
C语言学习笔记 - 40.数据类型 - scanf函数的编程规范与非法输入处理
c语言·开发语言·笔记·学习
Bechamz3 小时前
大数据开发学习Day36
大数据·学习
happymaker06264 小时前
SpringBoot学习日记——DAY02(SpringBoot整合Swagger3)
java·spring boot·学习
晓梦林5 小时前
homelab2靶场学习笔记
笔记·学习
AI绘画哇哒哒5 小时前
Agent三种思考模式深度解析:CoT/ReAct/Plan-and-Execute,小白程序员必看,助你轻松掌握大模型精髓(收藏版)
人工智能·学习·ai·程序员·大模型·产品经理·转行
LN花开富贵5 小时前
Ubuntu aarch64 架构安装 NoMachine 远程控制 避坑与实战
linux·运维·笔记·学习·ubuntu·嵌入式
-To be number.wan6 小时前
数据库单表查询全攻略
数据库·学习