神经网络与卷积神经网络(CNN)

1️⃣ 神经网络概念

  • 神经网络 = 一系列"黑盒计算模块"堆起来的函数
  • 输入 → 中间层 → 输出
  • 每一层学习规律(特征)
  • 类比:做菜
    • 食材 = 输入数据
    • 每道加工步骤 = 每层计算
    • 成品 = 输出结果

2️⃣ 卷积(Convolution / Conv)

  • 专门处理图像的操作
  • 类比滤镜:滑过图片计算加权和 → 输出特征图(feature map)
  • 输出通道数 = 卷积核数量
  • 卷积核作用:
    • 提取边缘、纹理、颜色变化
    • 每个输出通道对应一个卷积核提取的特征

3️⃣ 激活函数(Activation Function)

  • 作用:非线性映射,让网络可以表示复杂关系
  • 常见激活函数:
    • ReLU:负值变 0,正值保留
    • Sigmoid:输出 0~1
    • Tanh:输出 -1~1
  • 卷积 + 激活:
    1. 卷积提取特征
    2. 激活非线性处理 → 输出特征图(activation)
    3. 作为下一层输入

4️⃣ 特征图流动

  • 每层卷积 + 激活 → 输出特征图
  • 特征图一层层往下 → 层与层串行依赖
  • 每层内部计算可以并行(GPU/NPU 加速)

5️⃣ 卷积核与通道数

  • 每层卷积核数量 = 输出通道数
  • 每个卷积核都接收上一层所有通道 → 加权求和 → 输出一个通道
  • 上层通道数不一定等于下层通道数
    • 浅层 → 通道少
    • 深层 → 通道多
    • 特殊阶段 → 可以压缩(bottleneck)

6️⃣ 神经网络训练

1. 前向传播(Forward Pass)

  • 输入 → 每层卷积 + 激活 → 输出预测
  • 权重不变,只计算输出

2. 计算损失(Loss)

  • 预测 vs 标签 → 误差
  • 分类、检测等有不同损失函数

3. 反向传播(Backward Pass)

  • 计算每个卷积核对损失的梯度
  • 更新权重:
text 复制代码
weight_new = weight_old - learning_rate * gradient
  • 激活函数影响梯度大小

4. 训练 vs 推理

阶段 权重变化 张量类型
训练 权重更新 float32
推理 权重固定 float32

7️⃣ 网络设计选择

  • 影响因素:
    • 任务复杂度
    • 数据量和输入尺寸
    • 硬件能力与实时性
    • 实验验证
  • 常用经验:
    • 浅层少通道 → 提取低级特征
    • 深层多通道 → 提取高级特征
    • 车端 / 嵌入式 → 层少通道少 → 快速推理

8️⃣ 开源项目参考

  • 例如 YOLO 系列:
    • YOLOv3:固定 backbone + head → 53 层卷积 + 残差
    • YOLOv3-tiny / YOLOv8n → 轻量化网络适合车端
  • 优势:
    • 网络结构经过大量实验验证
    • 可直接拿来训练或部署

💡 这篇笔记总结了神经网络基础、卷积、激活、通道、训练

相关推荐
NQBJT3 分钟前
万字拆解 NeckFix:AI 脖子前倾检测的算法原理与工程实现
人工智能·算法
数智工坊9 分钟前
【Inner Monologue论文阅读】: 首次将大语言模型嵌入机器人控制闭环,实现自我反思和动态行为调整
论文阅读·人工智能·算法·语言模型·机器人·无人机
AI帮小忙16 分钟前
Debian/Ubuntu 系linux操作系统Kali Linux 2026 里安装 Hermes Agent
人工智能
乌恩大侠18 分钟前
基站正在成为 AI 计算节点:NVIDIA Aerial 推动 RAN 架构重构
人工智能·重构·架构
钓了猫的鱼儿23 分钟前
基于深度学习+AI的水下目标目标检测与预警系统(Python源码+数据集+UI可视化
人工智能·深度学习·智能手机
Ting-yu27 分钟前
Spring AI Alibaba零基础速成(6) ---- 向量化
数据库·人工智能
YUDAMENGNIUBI29 分钟前
day29_NLP概念与文本预处理
人工智能·自然语言处理
南屹川29 分钟前
【安全】代码安全审计与防护实践
人工智能
深开鸿32 分钟前
福田区全栈式鸿蒙AI数智机关入选全市首批OR示范应用项目,深开鸿筑牢政务安全底座
人工智能·openharmony·政务
进度猫32 分钟前
八款项目管理软件对比:功能、局限与适用团队
人工智能·项目管理·产品经理·甘特图·项目管理软件