算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
式51612 分钟前
大模型学习基础(六) 强化学习(Reinforcement Learning,RL)初步1.4
学习
小猪佩奇TONY17 分钟前
Linux 内核学习(13) --- linux 内核并发与竞态
linux·服务器·学习
黑客思维者19 分钟前
机器学习011:监督学习【回归算法】(多项式回归)-- 从“猜咖啡温度”到预测万物
人工智能·学习·机器学习·回归·线性回归·监督学习·多项式回归
deng-c-f20 分钟前
Linux C/C++ 学习日记(56):用户态网络缓存区
学习·缓存
d111111111d23 分钟前
STM32平衡车开发计划2-电机编码器测速
笔记·stm32·单片机·嵌入式硬件·学习
黑客思维者25 分钟前
机器学习010:监督学习【回归算法】(Lasso回归)-- 用“魔法剪刀”找到真正重要的信息
人工智能·学习·机器学习·回归·监督学习·回归算法·lasso
zhangrelay27 分钟前
新旧交替-传统模式被逐步抛弃……(节选)
学习
deng-c-f34 分钟前
Linux C/C++ 学习日记(55):原子操作(四):实现无锁队列
学习
小韩博42 分钟前
小迪安全 · 第 39 课学习笔记
笔记·学习·安全·网络安全
非凡ghost42 分钟前
Topaz Video(人工智能视频增强软件)
人工智能·windows·学习·音视频·软件需求