算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
stm32 菜鸟4 小时前
nucleo-f411re学习记录-12,Wifi模块ESP8684
学习
stm32 菜鸟6 小时前
nucleo-f411re学习记录-9,双轴XY摇杆传感器
学习
南子北游6 小时前
Python学习(基础语法1)
开发语言·python·学习
Atri厨7 小时前
X86存储器的段描述符学习随笔
学习
星幻元宇VR7 小时前
VR航空航天科普设备助力航天知识普及
人工智能·科技·学习·安全·vr·虚拟现实
d111111111d7 小时前
STM32-UART封装问题解析
笔记·stm32·单片机·嵌入式硬件·学习·算法
寒秋花开曾相惜8 小时前
(学习笔记)4.2 逻辑设计和硬件控制语言HCL(4.2.1 逻辑门&4.2.2 组合电路和HCL布尔表达式)
linux·网络·数据结构·笔记·学习·fpga开发
叶子野格8 小时前
《C语言学习:指针》12
c语言·开发语言·c++·学习·visual studio
光影少年8 小时前
前端线上屏幕出现卡顿如何排查?
开发语言·前端·javascript·学习·前端框架·node.js
aacd271910 小时前
C语言之预处理详解ヾ(•ω•`)o
c语言·学习