🐣 最简单的卷积与激活函数指南(带示例)

1. 卷积层是干啥的?

你可以把卷积层想象成:

  • 相机镜头 📷:不同的卷积核像不同滤镜,能抓住不同的特征。

  • 多层卷积 = 多重观察

    • 第一层:看边缘和线条
    • 第二层:看形状和纹理
    • 第三层:看出"这是一只猫"

2. 常用卷积函数(记住就好)

  • Conv1D → 处理 一维数据(声音波形、股票曲线)
  • Conv2D → 处理 图片(最常用)
  • Conv3D → 处理 视频 / 医学 CT 扫描
  • SeparableConv2D → 轻量化,适合 手机端模型
  • Conv2DTranspose → 把小图变大图(生成图片、分割任务)

👉 大多数情况下,图像直接用 Conv2D


3. 激活函数是干啥的?

没有激活函数,网络就像一个"只能拉直线的画家",学不了复杂图形。

激活函数让网络会"弯",能画出复杂关系。


4. 激活函数怎么选?

隐藏层(卷积层后面)

  • ReLU 👉 默认首选,简单好用
  • LeakyReLU 👉 ReLU 的改进版,避免神经元"死掉"
  • Swish / GELU 👉 更高级,现代模型里常用,但计算慢

输出层(最后一层,和任务相关)

  • 二分类 (猫 vs 狗) 👉 sigmoid
  • 多分类 (猫 / 狗 / 兔子) 👉 softmax
  • 回归(预测房价) 👉 不加激活(线性输出)

👉 口诀:中间层 ReLU,最后一层看任务。


5. 示例(大量对比)

示例 A:猫狗二分类

ini 复制代码
layers.Conv2D(32, (3,3), activation='relu')  # 隐藏层用 ReLU
...
layers.Dense(1, activation='sigmoid')        # 最后一层 sigmoid

示例 B:三分类(猫/狗/兔子)

ini 复制代码
layers.Conv2D(64, (3,3), activation='relu')  
...
layers.Dense(3, activation='softmax')        # 最后一层 softmax

示例 C:预测房价(回归)

ini 复制代码
layers.Conv2D(32, (3,3), activation='relu')  
...
layers.Dense(1)   # 最后一层不用激活

示例 D:声音数据(语音情感识别)

ini 复制代码
layers.Conv1D(64, 3, activation='relu', input_shape=(1000, 20))
layers.GlobalMaxPooling1D()
layers.Dense(3, activation='softmax')  # 三种情感

示例 E:视频分类(动作识别:跑 / 跳 / 走)

ini 复制代码
layers.Conv3D(32, (3,3,3), activation='relu', input_shape=(16, 112, 112, 3))
layers.MaxPooling3D((2,2,2))
layers.Dense(3, activation='softmax')  # 三类动作

示例 F:轻量化模型(移动端)

ini 复制代码
layers.SeparableConv2D(32, (3,3), activation='relu')
layers.Dense(1, activation='sigmoid')

6. 总结一句话

  • 卷积层选法:

    • 图片 → Conv2D
    • 视频 → Conv3D
    • 声音/文本 → Conv1D
  • 激活函数选法:

    • 中间层 → ReLU
    • 输出层 → 按任务选(sigmoid / softmax / 无)

👉 口诀:
"中间 ReLU,最后看任务;图像 2D,视频 3D,声音 1D。" 🎯

安装 tensflow 连接 windows

相关推荐
超哥--9 小时前
B站视频内容智能分析系统(九):React 前端与管理面板
前端·react.js·前端框架
Cutecat_12 小时前
视频字幕处理工具横向:提取模式 vs 编辑模式,该如何选择
android·前端·ios·语音识别
qq_4221525712 小时前
PDF 加水印工具怎么选?2026 年文档版权保护方案对比
前端·pdf·github
kyriewen13 小时前
手写 Promise.all、race、any:不到 30 行代码,解决并发异步的所有姿势
前端·javascript·面试
brucelee18613 小时前
OpenClaw 浏览器控制(Chrome MCP)完整教程
前端·chrome
ct97814 小时前
React 状态管理方案深度对比
开发语言·前端·react
胡志辉的博客14 小时前
深入浅出理解浏览器事件循环:从一道输出题讲到 Chrome 源码
前端·javascript·chrome·chromium·event loop
代码不加糖14 小时前
js中不会冒泡的事件有哪些?
前端·javascript·vue.js
懂懂tty14 小时前
Vue2与Vue3之间API差异
前端·javascript·vue.js
AI焦点14 小时前
跨越协议鸿沟:Tool Use状态机从Anthropic到OpenAI兼容体系的适配要点
前端·人工智能