算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
不灭锦鲤43 分钟前
网络安全学习第101天
学习
承渊政道1 小时前
【动态规划算法】(背包问题经典模型与解题套路)
数据结构·c++·学习·算法·leetcode·动态规划·哈希算法
遗憾随她而去.1 小时前
Java学习(一)
java·开发语言·学习
sealaugh322 小时前
react native(学习笔记第三课) 英语打卡微应用(2)-从上传图片开始
笔记·学习·react native
北冥有鱼被烹2 小时前
【玩索】【英语武器系统之1】用塞尔达武器系统学习英语语法
学习·english
开开心心就好3 小时前
整合多家平台资源的免费学习应用
人工智能·vscode·学习·游戏·音视频·语音识别·媒体
m0_46644103詹湛3 小时前
(一)FPGA :基础概念详解(Xilinx平台)
笔记·学习·fpga开发·verilog
_李小白3 小时前
【android opencv学习笔记】Day 5: 高效的图像扫描
android·opencv·学习
USC-XiangLuXun3 小时前
多学科视野的计算机演变
科技·学习·生活
咸甜适中3 小时前
rust语言学习笔记Trait之Debug、Display
笔记·学习·rust