Dense / 全连接层 / Gemm — 综合全局特征理解与运用

Dense / 全连接层 / GEMM 解决的是"把前面提取出来的局部特征综合起来,做最终判断"的问题。

卷积层:发现局部特征,比如边缘、纹理、局部形状

Flatten:把这些特征摊平

Dense:把所有特征放在一起综合分析,最后输出分类结果

比如前面卷积已经知道:

左上角像眼睛

中间像鼻子

下方像嘴巴

那 Dense 层做的就是:

把这些零散特征拼起来,判断这是不是一张脸

Dense / 全连接层的作用,就是把前面提取到的全部特征做全局整合,输出最终结果。

所以这几个层你现在可以这样记:

  • Conv:提局部特征

  • ReLU:加非线性

  • Flatten:摊平数据

  • Dense:综合全局特征做判断

这套链条,你总算开始摸到 CNN 的骨架了。

cpp 复制代码
/* Dense1: 960 → 48 */
float input[960];      // Flatten 的输出
float output[48];
float weight[48][960]; // 权重矩阵(46,080 个参数)
float bias[48];

for (int j = 0; j < 48; j++) {         // 48 个输出神经元
    float sum = bias[j];
    for (int i = 0; i < 960; i++) {     // 与 960 个输入全连接
        sum += weight[j][i] * input[i];   // ← 1 次 MAC
    }
    output[j] = sum;
}
// Dense1 总计: 960 × 48 = 46,080 次 MAC

/* Dense2: 48 → 4 */
float input2[48];      // Dense1+ReLU 的输出
float output2[4];      // 最终输出 [Fx, Fy, Fz, Fn]
float weight2[4][48];
float bias2[4];

for (int j = 0; j < 4; j++) {
    float sum = bias2[j];
    for (int i = 0; i < 48; i++) {
        sum += weight2[j][i] * input2[i];
    }
    output2[j] = sum;  // → 接 Sigmoid 后变成 [0,1] 范围
}
// Dense2 总计: 48 × 4 = 192 次 MAC

权重和 MACs 占比

复制代码
权重占比:
  Conv1-3 合计: 66 KB(26.8%)
  Dense1:       180 KB(~73%)   ← 绝对大头
  Dense2:       0.8 KB(<1%)
  总计:         247 KB

MACs 占比:
  Conv1-3 合计: 725,760(93.5%)  ← 绝对大头
  Dense1:       46,080(5.9%)
  Dense2:       192(<0.1%)
  总计:         776,032
  • 想减权重/Flash → 压缩 Dense1(比如 960→24 只用 90KB)
  • 想减计算量/推理时间 → 优化 Conv 层(比如 DepthwiseConv)
相关推荐
搬砖的小码农_Sky4 分钟前
特斯拉FSD Supervised(监督版)的技术原理
人工智能·ai·自动驾驶
cskywit4 分钟前
用扩散模型“一次生成图像和标注”:CoSimGen 如何实现可控的图像-Mask 同步生成
人工智能·深度学习·计算机视觉
大模型真好玩9 分钟前
大模型训练全流程实战指南工具篇(十二)—— 大模型评测方法及典型评测集介绍
人工智能·agent·deepseek
leduo668899o9 分钟前
线上教培系统服务商对比:直播联动、课程回放,哪家功能更全面?
人工智能·科技
tzc_fly10 分钟前
LLaDA2.0-Uni:基于扩散语言模型的统一多模态理解和生成
人工智能·语言模型·自然语言处理
EdmundXjs11 分钟前
大模型核心概念解读
人工智能·算法
子榆.12 分钟前
CANN ATC编译器:模型从Python到达芬奇指令走了多远
开发语言·python·neo4j
最贪吃的虎12 分钟前
DeerFlow 记忆系统:让 AI Agent 真正“认识“你
人工智能
lookaroundd12 分钟前
llm-compressor 普通量化调用链分析
python·算法
prog_610315 分钟前
【笔记】用cursor手搓cursor(六)deepseek v4
人工智能·笔记·agent·deepseek·claude code