基于FPGA的卷积神经网络实现-Step2 卷积模块设计文档说明:本文档是 Step 2——CNN 流式卷积加速器的子模块级详细设计报告。Step 1 建立了"分块 + 迭代"的数学框架并论证了算子层可行性;Step 2 在此基础上将理论落地为硬件微架构,聚焦于单个子模块 Conv_Kernel.V 的完整 RTL 设计。全文覆盖 Step1 核心回顾、模块接口与数据格式、五级流水线详细设计、BRAM 与 FIFO 资源计算以及多层次验证策略。所有设计同时覆盖 C S I Z E = 3 C_{SIZE}=3 CSIZE=3(9 子模块)和 C S I Z E