算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
呱呱巨基2 小时前
Linux 进程概念
linux·c++·笔记·学习
yong15858553433 小时前
2. Linux C++ muduo 库学习——原子变量操作头文件
linux·c++·学习
IDIOT___IDIOT4 小时前
KNN and K-means 监督与非监督学习
学习·算法·kmeans
Rousson4 小时前
硬件学习笔记--91 TMR型互感器介绍
笔记·学习
前端 贾公子5 小时前
Vue响应式原理学习:基本原理
javascript·vue.js·学习
Slaughter信仰5 小时前
图解大模型_生成式AI原理与实战学习笔记前四张问答(7题)
人工智能·笔记·学习
2401_834517076 小时前
AD学习笔记-26 Active Routing
笔记·学习
QiZhang | UESTC7 小时前
学习日记day45
学习
菜鸟‍7 小时前
【论文学习】通过编辑习得分数函数实现扩散模型中的图像隐藏
人工智能·学习·机器学习
知识分享小能手7 小时前
CentOS Stream 9入门学习教程,从入门到精通,CentOS Stream 9 配置网络功能 —语法详解与实战案例(10)
网络·学习·centos