算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
我命由我123453 分钟前
开发中的英语积累 P25:Axis、Stroke、Corner、Interceptor、Declared、Internal
经验分享·笔记·学习·职场和发展·求职招聘·职场发展·学习方法
扑火的小飞蛾15 分钟前
【Ansible学习笔记01】 批量执行 shell 命令
笔记·学习·ansible
d111111111d19 分钟前
STM32 USART接收中断:如何判断数据接收完成?
stm32·单片机·嵌入式硬件·学习·模块测试
报错小能手26 分钟前
线程池学习(一) 理解操作系统 进程 线程 协程及上下文切换
学习
pps-key29 分钟前
麻雀AI:一个能自己学习交易的智能体
人工智能·学习
YangYang9YangYan42 分钟前
2026年大专大数据与会计专业核心证书推荐
大数据·学习·数据分析
炽烈小老头1 小时前
【 每天学习一点算法 2026/01/04】打家劫舍
学习·算法
漏刻有时1 小时前
微信小程序学习实录13:网络PDF文件的下载、本地缓存、预览、保存及主动转发
网络·学习·微信小程序
毛小茛1 小时前
芋道管理系统学习——简介
学习
漏刻有时1 小时前
微信小程序学习实录12:wx.serviceMarket.invokeService接口OCR识别营业执照和银行卡
学习·微信小程序·ocr