算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
许小禾上学记3 分钟前
Python 爬虫从入门到(不)入狱学习笔记
爬虫·python·学习
惠惠软件30 分钟前
误删了照片,甚至对存储卡进行了格式化 都可以找到丢失的图片,并让您恢复它们 支持一键恢复或永久删除丢失的照片、视频、音乐、文档等-供大家学习研究参考
学习
xnuscd1 小时前
els学习
运维·学习·jenkins
Qhumaing1 小时前
C/C++学习-引用
c语言·c++·学习
thesky1234562 小时前
活着就好20241126
学习·算法
cwtlw2 小时前
java学习记录12
java·开发语言·学习
美式小田3 小时前
Altium Designer学习笔记 21.PCB板框的评估及叠层设置
笔记·嵌入式硬件·学习·ad
NightCyberpunk3 小时前
请求响应(学习笔记)
笔记·学习
企业通用软件开发3 小时前
大语言模型提示词工程学习--写小说系列(文心一言&豆包&通义千问):2~确定核心谜团
学习·语言模型·ai应用·ai编写长篇小说·大语言模型应用