算法学习-2024.8.16

一、Tensorrt学习补充

TensorRT支持INT8和FP16的计算。 深度学习网络在训练时,通常使用 32 位或 16 位数据。TensorRT则在网络的推理时选用不这么高的精度,达到加速推断的目的

TensorRT对于网络结构进行了重构,把一些能够合并的运算合并在了一起,针对GPU的特性做了优化。

一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。

相关推荐
学编程的闹钟1 小时前
E语言计算器开发全攻略
学习
薛定e的猫咪1 小时前
Claude Code 完整学习手册:安装配置、CCR、MCP、插件与 Superpowers开发框架
学习
雾山大叔2 小时前
多会话浏览器串口调试助手
经验分享·笔记·学习
小凯123453 小时前
pytest框架-详解(学习pytest框架这一篇就够了)
python·学习·pytest
今儿敲了吗3 小时前
29| 高考志愿
c++·笔记·学习·算法
浅念-4 小时前
C++ 模板进阶
开发语言·数据结构·c++·经验分享·笔记·学习·模版
mightbxg6 小时前
【学习一下】深入理解交叉熵
人工智能·学习·机器学习
weixin_458872616 小时前
东华复试OJ每日3题打卡·复盘100~102
学习
我命由我123457 小时前
Photoshop - Ps还原和历史记录
学习·ui·职场和发展·求职招聘·职场发展·学习方法·photoshop
我命由我123457 小时前
Photoshop - Ps工作界面
学习·ui·职场和发展·求职招聘·职场发展·学习方法·photoshop