算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
学编程的闹钟1 小时前
PHP变量类型转换机制全解析
学习
AI360labs_atyun5 小时前
字节AI双王炸来了!Seedance 2.0 + Seedream 5.0
人工智能·科技·学习·百度·ai
不用89k5 小时前
SpringBoot学习新手项初识请求
java·spring boot·学习
汐汐咯5 小时前
CNN学习
深度学习·学习·cnn
shadow fish6 小时前
react学习记录(三)
javascript·学习·react.js
Aliex_git6 小时前
浏览器 API 兼容性解决方案
前端·笔记·学习
四谎真好看6 小时前
SSM学习笔记(Spring篇 Day02)
笔记·学习·学习笔记·ssm
瞎某某Blinder9 小时前
DFT学习记录[3]:material project api使用方法 mp_api调取与pymatgen保存
java·笔记·python·学习
学编程的闹钟10 小时前
PHP编程高手的信息检索与文档查阅秘籍
学习
im_AMBER10 小时前
Leetcode 119 二叉树展开为链表 | 路径总和
数据结构·学习·算法·leetcode·二叉树