一种超轻量级神经网络加速器实现

一 目标

针对资源受限,SWaP敏感的边缘计算应用场景,探索稳健而高效的计算架构,算法和应用。 并完成超轻量级神经网络加速器设计和验证。

1、实时性能:30~50FPS

2、超低功耗:mW级别

3、资源受限:包括计算资源/存储资源/通信带宽等

4、成本低廉:

二 设计分析

。。。

三 验证

网络模型:优化设计的YOLOV3

FPGA硬件平台:ZYNQ7020

性能:35FPS(150MHz)

资源消耗7K LUT

四 参考文献

1\] TinyNPU \[2\] DAC-SDC

相关推荐
工藤学编程1 分钟前
零基础学AI大模型之RAG技术
人工智能
安替-AnTi18 分钟前
PandaWiki:AI 驱动的开源知识库系
人工智能·embedding·检索增强·知识库·rag·查询优化
迦蓝叶21 分钟前
JAiRouter v1.0.0 正式发布:企业级 AI 服务网关的开源解决方案
java·运维·人工智能·网关·spring·ai·开源
长空任鸟飞_阿康28 分钟前
Node.js 核心模块详解:fs 模块原理与应用
前端·人工智能·ai·node.js
可触的未来,发芽的智生32 分钟前
触摸未来2025-10-18:生成文字的小宇宙矩阵溯源
人工智能·python·神经网络·程序人生·自然语言处理
武子康41 分钟前
AI-调查研究-106-具身智能 机器人学习数据采集工具和手段:传感器、API、遥操作、仿真与真人示教全流程
人工智能·深度学习·机器学习·ai·系统架构·机器人·具身智能
Python智慧行囊43 分钟前
图像处理-opencv(一)
人工智能·opencv·计算机视觉
StarPrayers.1 小时前
损失函数(Loss Function)、反向传播(Backward Propagation)和优化器(Optimizer)学习笔记
人工智能·笔记·深度学习·学习
IT_陈寒1 小时前
Vite 5个隐藏技巧让你的项目构建速度提升50%,第3个太香了!
前端·人工智能·后端
孤廖1 小时前
吃透 C++ 栈和队列:stack/queue/priority_queue 用法 + 模拟 + STL 标准实现对比
java·开发语言·数据结构·c++·人工智能·深度学习·算法