图像处理ASIC设计方法 笔记8 卷积计算芯片的结构

(一)

P81 卷积芯片内部模板框图

该设计有两个数据通路:图像数据和模板数据

图像数据是经过帧控制、实时图SPRAM(写控制、 SPRAM读控制、数据读控制)、计算单元;

模板数据是经过模板SPRAM、计算单元。

4.5.4运算单元像素寄存器控制

存储SPRAM写入的64bit数据,输出为8bit。它是属于图像数据的路径。

当处于读操作时,输出的读使能信号fifo_rd_en ,该信号可以使FIFO读出数据并写入SPRAM中。那这个模块是实时图SPRAM模块里的写控制、SPRAM读控制、数据读控制。

图像SPRAM地址控制:SPRAM中滚动存放32行像素,为了同时读出相邻4行数据,写入数据按行在4个块中依次循环存放。32*40像素模板卷积运算分8次局部卷积运算完成。

(二)

P90 计算模块的结构:

乘法器1个,后面是加法器6个,这样组成的流水线。同时有6组数据在依次滚动,走的流水线深度是7拍(乘法器1个+加法器6个)。第六组数据刚进入第一个拍(乘法器)的时候,此时第一组数据在第六个拍(加法器5)处理。

计算模块大小是4行40列,整个卷积设计的大小为32行40列,数据缓存是对计算模块的大小来定的(4行40列)。整个卷积设计是调用8次计算模块("32行40列"是"4行40列"的8倍),把每次的计算模块结果进行累加

计算模块的结果在另一个位置缓存,每次的结果与对应位置的数据累加后还写入该位置。这个位置的寄存器设置的位宽是26bit。(最初的像素数据是8bit,经过一次乘法和六次加法,结果是22bit,22bit累加8次,最终设定的计算结果是26bit)

(三)

补充搜索的资料 卷积芯片的新设计方式:

光学卷积处理器OCPU(Optical Convolution Processing Unit)是一种基于光学计算的技术,它使用光学器件和光学现象进行信息处理和计算。光学能够同时处理多个信息,从而实现高效的并行计算。

中国科学院半导体研究所集成光电子国家重点实验室微波光电子研究组开发了一种超高集成度光学卷积处理器,相关研究成果发表在《Nature-Communications》上。这项技术在人工智能领域具有广阔的前景。光学计算是一种利用光波作为信息处理载体的技术,具有带宽大、延迟低、功耗低的优点。

相关推荐
ai生成式引擎优化技术1 分钟前
ChatGPT AI生成式引擎优化*(GEO)方案
人工智能
云原生指北1 分钟前
让 AI 自己进化自己:深入 HyperAgents
人工智能
小二·4 分钟前
2026年AI工具终极对比:豆包、DeepSeek、元宝、ChatGPT、Cursor,谁才是你的最佳搭档?(万字深度评测)
人工智能·chatgpt
weixin_408099676 分钟前
身份证正反面合并+识别OCR接口调用
java·人工智能·后端·python·ocr·api·身份证ocr
CHPCWWHSU6 分钟前
深入 llama.cpp:词汇表与分词——从文本到 Token (4)
人工智能·llm·llama·cpp·cudatoolkit
昨夜见军贴06167 分钟前
AI报告编审解决方案全面升级:IA-Lab AI检测报告生成助手与IACheck让报告生产进入“轻松高效”新阶段
人工智能
vx_biyesheji00017 分钟前
计算机毕业设计:Python汽车市场智能决策系统 Flask框架 可视化 机器学习 AI 大模型 大数据(建议收藏)✅
大数据·人工智能·python·算法·django·汽车·课程设计
源码之家8 分钟前
计算机毕业设计:Python汽车销量智能可视化与预测系统 Flask框架 可视化 机器学习 AI 大模型 大数据(建议收藏)✅
大数据·人工智能·python·机器学习·信息可视化·汽车·课程设计
Dfreedom.9 分钟前
神经网络算法全景解析
人工智能·神经网络·算法
特别关注外国供应商11 分钟前
Netskope 安全与网络重塑人工智能
网络·人工智能·安全·零信任·访问控制·sase·netskope