算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
d111111111d11 小时前
STM32 GPIO输出模式配置详解:从寄存器层面理解引脚控制
笔记·stm32·单片机·嵌入式硬件·学习
曾浩轩11 小时前
跟着江协科技学STM32之4-1OLED调试工具
科技·stm32·单片机·学习
solicitous21 小时前
人工智能发展的关键阶段概览
学习
FPGAI21 小时前
Java学习之基础概念
java·学习
专注于大数据技术栈1 天前
java学习--Date
java·学习
94620164zwb51 天前
学习提醒模块 Cordova 与 OpenHarmony 混合开发实战
学习
北岛寒沫1 天前
北京大学国家发展研究院 经济学辅修 经济学原理课程笔记(第十五章 劳动力市场)
经验分享·笔记·学习
丝斯20111 天前
AI学习笔记整理(37)——自然语言处理的基本任务
人工智能·笔记·学习
BreezeJuvenile1 天前
通用定时器_测量PWM方波的周期和占空比案例
stm32·单片机·学习·通用定时器·pwm输入·测量占空比
周末不下雨1 天前
发明专利学习记录
学习