算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
优雅的潮叭1 小时前
c++ 学习笔记之 shared_ptr
c++·笔记·学习
am心2 小时前
学习笔记-用户下单
笔记·学习
微露清风2 小时前
系统性学习C++-第二十二讲-C++11
java·c++·学习
进阶小白猿3 小时前
Java技术八股学习Day20
java·开发语言·学习
renhongxia13 小时前
学习基于数字孪生的工艺参数优化
学习
gjf05_053 小时前
人该怎样活着呢?版本68.6
学习
GISer_Jing4 小时前
AI Agent 智能体的“深度思考”与“安全防线”
人工智能·学习·安全·aigc
我命由我123455 小时前
充血模型与贫血模型
java·服务器·后端·学习·架构·java-ee·系统架构
时间会给答案scidag5 小时前
Spring AI Alibaba 学习day01
人工智能·学习·spring
风送雨6 小时前
FastAPI 学习教程 · 第4部分
学习·fastapi