【调研】YOLO算法在FPGA/ZYNQ上的部署与加速

FINN 是 AMD 研究与高级开发部门综合通信和人工智能实验室开发的机器学习框架。它为在 FPGA 上探索和实施量化神经网络推理解决方案提供了端到端流程。FINN 生成数据流架构作为空间中实施的自定义网络的物理表示。它不是通用的 DNN 加速解决方案,而是依赖于协同设计和设计空间探索来进行量化和并行化调整,从而根据资源和性能要求优化解决方案。

特征

  • 模板化的 Vitis HLS 和 RTL 流组件库: FINN 附带 HLS 和 RTL 模块库,可将神经网络层实现为流组件。
  • 通过数据流实现超低延迟和高性能:通过为每一层组合流式传输组件,FINN 可以生成能够以亚微秒延迟对图像进行分类的加速器。
  • 许多端到端示例设计:我们提供的示例从训练量化神经网络开始,一直到在硬件上运行的加速设计。这些示例涵盖了一系列数据集和网络拓扑。
  • 快速设计生成的工具流: FINN 工具流支持自动或手动为每层分配单独的计算资源,并生成完整的设计以供综合。这样可以快速探索设计空间。

FINN 团队由 Ralph Wittig 领导的 AMD 研究成员(AMD 研究与高级开发部)以及 Allen Chen 领导的定制与战略工程部成员组成,与 Pynq 团队密切合作。

从左上到右下:Yaman Umuroglu、Michaela Blott、Thomas Preusser、Jakoba Petri-Koenig、Lucian Petrica、Nicholas Fraser、Linus Witschen、Ken O'Brien、Tobias Alonso Pugliese、Petra Hrg

从左上到右下:Eamonn Dunbar、Kasper Feurer、Aziz Bahri、John Monks、Mirza Mrahorovic

相关推荐
坏孩子的诺亚方舟7 天前
FPGA系统架构设计实践15_高云Arora V系列时钟体系
fpga开发·系统架构
大鱼>7 天前
地平线BPU部署实战:YOLOv8在J5/X3上的算法适配与性能优化
算法·yolo·性能优化
stsdddd7 天前
YOLO系列目标检测数据集大全【第二十九期】
yolo·目标检测·目标跟踪
大鱼>7 天前
YOLO边缘部署深度指南:从YOLOv8n到NPU加速的全链路优化
yolo·aiot
AI棒棒牛7 天前
第 03 讲《监督学习:数据、标签、Loss与训练循环》
人工智能·学习·yolo·目标检测·yolo26
FPGA小徐7 天前
入门 CNN 结构全解析|从流程图理论到 FPGA Verilog 硬件实现(含习题带讲解)
fpga开发
FL16238631297 天前
国内快递面单识别检测数据集VOC+YOLO格式422张6类别
人工智能·yolo·机器学习
FPGA小徐7 天前
FPGA 数字信号处理:并行 FIR 与串行滤波器设计原理、对比与完整 Verilog 实现
fpga开发
stsdddd7 天前
YOLO系列目标检测数据集大全【第三十期】
yolo·目标检测·目标跟踪
YOLO数据集集合7 天前
无人机航拍地质灾害智能识别 山体滑坡实例分割数据集落地实战 | 泥石流监测 道路险情封堵 深度学习模型训练方案10296期
人工智能·深度学习·yolo·目标检测·无人机