算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
华舞灵瞳21 分钟前
学习FPGA(八)快速傅里叶变换
学习·fpga开发
褪色的博客42 分钟前
强化学习入门:价值学习——从“试错”到“预判”的飞跃
学习
wdfk_prog2 小时前
[Linux]学习笔记系列 -- [fs]inode
linux·笔记·学习
AI视觉网奇2 小时前
ue 蓝图动画学习笔记
笔记·学习·ue5
潲爺2 小时前
Java-多线程
java·笔记·学习
手揽回忆怎么睡2 小时前
Streamlit学习笔记
笔记·学习
潲爺3 小时前
Java-IO笔记
java·笔记·学习
Fairy要carry4 小时前
VLLM学习-推理阶段generate
学习
糕......4 小时前
Java异常处理完全指南:从概念到自定义异常
java·开发语言·网络·学习
好奇龙猫4 小时前
【人工智能学习-AI-MIT公开课-第5. 搜索:最优、分支限界、A**】
人工智能·学习