2022最新版-李宏毅机器学习深度学习课程-P17 卷积神经网络CNN

一、CNN 用于图像分类

需要图片大小统一

彩色图像分为R G B 三层,展平后首尾相接

值代表着颜色的强度

图像识别中不需要全连接的,参数太多了

观测1:通过判断多个小局部图像就能判断出图片标签

感受野的定义

简化1

  • 感受野可以重叠;
  • 同一感受野可以通过不同的权重

典型设置

观测2:相同部分出现在不同区域

简化2

共享参数

典型设置

引入filter的概念,实质是同一套权重

卷积的优势

  • 有些要素比整张图片小的多
  • 同一要素可能会出现在不同区域

二、另一角度切入

卷积层

多次经过卷积层

在第二次卷积时,输入的原始图片信息增加了!

所以不是一直分区域处理的。随着层数的增加,考虑的范围会逐渐变大

三、两种介绍的对比

分享的权重其实就是filter

卷积 = 不同的filter扫过整个矩阵 = 不同的感受野公用权重参数

观测3:截出主要元素不会改变标签

引入池化层

每次选出一个作为代表

MAX pooling:每个区域选出最大的作为代表

四、CNN全过程总结

五、应用:下围棋

每个棋子有48个channel,代表48个状态

CNN为啥能用于下围棋?因为他们的这两点特征相似

由于棋子不能省略,用于围棋中不能加入池化层

更多应用:语音、自然语音处理。。。

相关推荐
CoovallyAIHub1 天前
仿生学突破:SILD模型如何让无人机在电力线迷宫中发现“隐形威胁”
深度学习·算法·计算机视觉
CoovallyAIHub1 天前
从春晚机器人到零样本革命:YOLO26-Pose姿态估计实战指南
深度学习·算法·计算机视觉
CoovallyAIHub1 天前
Le-DETR:省80%预训练数据,这个实时检测Transformer刷新SOTA|Georgia Tech & 北交大
深度学习·算法·计算机视觉
CoovallyAIHub1 天前
强化学习凭什么比监督学习更聪明?RL的“聪明”并非来自算法,而是因为它学会了“挑食”
深度学习·算法·计算机视觉
CoovallyAIHub1 天前
YOLO-IOD深度解析:打破实时增量目标检测的三重知识冲突
深度学习·算法·计算机视觉
用户1474853079742 天前
AI-动手深度学习环境搭建-d2l
深度学习
OpenBayes贝式计算2 天前
解决视频模型痛点,TurboDiffusion 高效视频扩散生成系统;Google Streetview 涵盖多个国家的街景图像数据集
人工智能·深度学习·机器学习
OpenBayes贝式计算2 天前
OCR教程汇总丨DeepSeek/百度飞桨/华中科大等开源创新技术,实现OCR高精度、本地化部署
人工智能·深度学习·机器学习
在人间耕耘3 天前
HarmonyOS Vision Kit 视觉AI实战:把官方 Demo 改造成一套能长期复用的组件库
人工智能·深度学习·harmonyos