算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
浅念-12 小时前
C++ STL stack、queue 与容器适配器详解
开发语言·c++·经验分享·笔记·学习·面试
2501_9181269112 小时前
stm32能刷什么程序?
linux·stm32·单片机·嵌入式硬件·学习
第七序章12 小时前
【Linux学习笔记】git三板斧
linux·运维·服务器·笔记·git·学习
xhyu6113 小时前
【学习笔记】推荐系统 (1.基础知识)
笔记·学习
软件资深者13 小时前
2026 版初中几何辅助线教材 PDF|打印即提分,中考几何 “分水岭” 一键通关
学习·数学·pdf·教学·初中数学
速易达网络13 小时前
AI学习路径 python到openclaw
人工智能·python·学习
夜瞬13 小时前
【Flask 框架学习】01:编写第一个 Flask 应用
后端·python·学习·flask
我命由我1234513 小时前
Photoshop - Photoshop 工具栏(68)内容感知移动工具
学习·ui·职场和发展·求职招聘·职场发展·学习方法·photoshop
2501_9436953314 小时前
大专商务数据分析与应用专业,怎么学习电商数据的埋点知识?
学习·数据挖掘·数据分析
陈天伟教授14 小时前
人工智能应用- 材料微观:08.SliceGAN 的学习过程
人工智能·深度学习·学习