一种超轻量级神经网络加速器实现

一 目标

针对资源受限,SWaP敏感的边缘计算应用场景,探索稳健而高效的计算架构,算法和应用。 并完成超轻量级神经网络加速器设计和验证。

1、实时性能:30~50FPS

2、超低功耗:mW级别

3、资源受限:包括计算资源/存储资源/通信带宽等

4、成本低廉:

二 设计分析

。。。

三 验证

网络模型:优化设计的YOLOV3

FPGA硬件平台:ZYNQ7020

性能:35FPS(150MHz)

资源消耗7K LUT

四 参考文献

[1] TinyNPU

[2] DAC-SDC

相关推荐
珠海新立电子科技有限公司2 小时前
FPC柔性线路板与智能生活的融合
人工智能·生活·制造
IT古董2 小时前
【机器学习】机器学习中用到的高等数学知识-8. 图论 (Graph Theory)
人工智能·机器学习·图论
曼城周杰伦2 小时前
自然语言处理:第六十三章 阿里Qwen2 & 2.5系列
人工智能·阿里云·语言模型·自然语言处理·chatgpt·nlp·gpt-3
余炜yw3 小时前
【LSTM实战】跨越千年,赋诗成文:用LSTM重现唐诗的韵律与情感
人工智能·rnn·深度学习
莫叫石榴姐3 小时前
数据科学与SQL:组距分组分析 | 区间分布问题
大数据·人工智能·sql·深度学习·算法·机器学习·数据挖掘
96773 小时前
对抗样本存在的原因
深度学习
如若1234 小时前
利用 `OpenCV` 和 `Matplotlib` 库进行图像读取、颜色空间转换、掩膜创建、颜色替换
人工智能·opencv·matplotlib
YRr YRr4 小时前
深度学习:神经网络中的损失函数的使用
人工智能·深度学习·神经网络
ChaseDreamRunner4 小时前
迁移学习理论与应用
人工智能·机器学习·迁移学习
Guofu_Liao4 小时前
大语言模型---梯度的简单介绍;梯度的定义;梯度计算的方法
人工智能·语言模型·矩阵·llama