神经网络与卷积神经网络(CNN)

1️⃣ 神经网络概念

  • 神经网络 = 一系列"黑盒计算模块"堆起来的函数
  • 输入 → 中间层 → 输出
  • 每一层学习规律(特征)
  • 类比:做菜
    • 食材 = 输入数据
    • 每道加工步骤 = 每层计算
    • 成品 = 输出结果

2️⃣ 卷积(Convolution / Conv)

  • 专门处理图像的操作
  • 类比滤镜:滑过图片计算加权和 → 输出特征图(feature map)
  • 输出通道数 = 卷积核数量
  • 卷积核作用:
    • 提取边缘、纹理、颜色变化
    • 每个输出通道对应一个卷积核提取的特征

3️⃣ 激活函数(Activation Function)

  • 作用:非线性映射,让网络可以表示复杂关系
  • 常见激活函数:
    • ReLU:负值变 0,正值保留
    • Sigmoid:输出 0~1
    • Tanh:输出 -1~1
  • 卷积 + 激活:
    1. 卷积提取特征
    2. 激活非线性处理 → 输出特征图(activation)
    3. 作为下一层输入

4️⃣ 特征图流动

  • 每层卷积 + 激活 → 输出特征图
  • 特征图一层层往下 → 层与层串行依赖
  • 每层内部计算可以并行(GPU/NPU 加速)

5️⃣ 卷积核与通道数

  • 每层卷积核数量 = 输出通道数
  • 每个卷积核都接收上一层所有通道 → 加权求和 → 输出一个通道
  • 上层通道数不一定等于下层通道数
    • 浅层 → 通道少
    • 深层 → 通道多
    • 特殊阶段 → 可以压缩(bottleneck)

6️⃣ 神经网络训练

1. 前向传播(Forward Pass)

  • 输入 → 每层卷积 + 激活 → 输出预测
  • 权重不变,只计算输出

2. 计算损失(Loss)

  • 预测 vs 标签 → 误差
  • 分类、检测等有不同损失函数

3. 反向传播(Backward Pass)

  • 计算每个卷积核对损失的梯度
  • 更新权重:
text 复制代码
weight_new = weight_old - learning_rate * gradient
  • 激活函数影响梯度大小

4. 训练 vs 推理

阶段 权重变化 张量类型
训练 权重更新 float32
推理 权重固定 float32

7️⃣ 网络设计选择

  • 影响因素:
    • 任务复杂度
    • 数据量和输入尺寸
    • 硬件能力与实时性
    • 实验验证
  • 常用经验:
    • 浅层少通道 → 提取低级特征
    • 深层多通道 → 提取高级特征
    • 车端 / 嵌入式 → 层少通道少 → 快速推理

8️⃣ 开源项目参考

  • 例如 YOLO 系列:
    • YOLOv3:固定 backbone + head → 53 层卷积 + 残差
    • YOLOv3-tiny / YOLOv8n → 轻量化网络适合车端
  • 优势:
    • 网络结构经过大量实验验证
    • 可直接拿来训练或部署

💡 这篇笔记总结了神经网络基础、卷积、激活、通道、训练

相关推荐
数智化精益手记局41 分钟前
拆解物料管理erp系统的核心功能,看物料管理erp系统如何解决库存积压与缺料难题
大数据·网络·人工智能·安全·信息可视化·精益工程
Flying pigs~~1 小时前
RAG 完整面试指南:原理、优化、幻觉解决方案
人工智能·prompt·rag·智能体·检索增强生成·rag优化
博.闻广见1 小时前
AI_概率统计-2.常见分布
人工智能·机器学习
企业架构师老王1 小时前
2026制造业安全生产隐患识别AI方案:从主流产品对比看企业级AI Agent的非侵入式落地路径
人工智能·安全·ai
Aleeeeex1 小时前
RAG 那点事:从 8 份企业文档到能用的问答系统,全过程拆给你看
人工智能·python·ai编程
冬奇Lab1 小时前
一天一个开源项目(第87篇):Tank-OS —— Red Hat 工程师用一个周末,把 AI Agent 塞进了一个可启动的 Linux 镜像
人工智能·开源·资讯
小糖学代码1 小时前
LLM系列:2.pytorch入门:8.神经网络的损失函数(criterion)
人工智能·深度学习·神经网络
Captaincc2 小时前
转发-中央网信办部署开展“清朗·整治AI应用乱象”专项行动
人工智能·vibecoding
AI自动化工坊2 小时前
Late框架技术深度解析:5GB VRAM实现10倍AI编码效率的工程架构
人工智能·5g·架构·ai编程·late
我是大聪明.2 小时前
DeepSeek V4 Pro + 华为昇腾910:国产大模型落地的性能实测与深度解析
人工智能·华为