2022最新版-李宏毅机器学习深度学习课程-P17 卷积神经网络CNN

一、CNN 用于图像分类

需要图片大小统一

彩色图像分为R G B 三层,展平后首尾相接

值代表着颜色的强度

图像识别中不需要全连接的,参数太多了

观测1:通过判断多个小局部图像就能判断出图片标签

感受野的定义

简化1

  • 感受野可以重叠;
  • 同一感受野可以通过不同的权重

典型设置

观测2:相同部分出现在不同区域

简化2

共享参数

典型设置

引入filter的概念,实质是同一套权重

卷积的优势

  • 有些要素比整张图片小的多
  • 同一要素可能会出现在不同区域

二、另一角度切入

卷积层

多次经过卷积层

在第二次卷积时,输入的原始图片信息增加了!

所以不是一直分区域处理的。随着层数的增加,考虑的范围会逐渐变大

三、两种介绍的对比

分享的权重其实就是filter

卷积 = 不同的filter扫过整个矩阵 = 不同的感受野公用权重参数

观测3:截出主要元素不会改变标签

引入池化层

每次选出一个作为代表

MAX pooling:每个区域选出最大的作为代表

四、CNN全过程总结

五、应用:下围棋

每个棋子有48个channel,代表48个状态

CNN为啥能用于下围棋?因为他们的这两点特征相似

由于棋子不能省略,用于围棋中不能加入池化层

更多应用:语音、自然语音处理。。。

相关推荐
想成为风筝5 小时前
从零开始学习深度学习—水果分类之PyQt5App
人工智能·深度学习·计算机视觉·pyqt
大知闲闲哟5 小时前
深度学习G2周:人脸图像生成(DCGAN)
人工智能·深度学习
vv_5017 小时前
深度学习 tensor及其相关操作
人工智能·深度学习·tensor基础操作
whabc1007 小时前
和鲸社区深度学习基础训练营2025年关卡2(1)纯numpy
人工智能·深度学习
Coovally AI模型快速验证8 小时前
基于YOLOv11的CF-YOLO,如何突破无人机小目标检测?
人工智能·神经网络·yolo·目标检测·计算机视觉·cnn·无人机
深度学习机器9 小时前
OCRFlux-3B:开源 OCR + LLM 模型的新标杆,支持跨页表格合并
人工智能·机器学习·语言模型·ocr
胡耀超10 小时前
Umi-OCR 的 Docker安装(win制作镜像,Linux(Ubuntu Server 22.04)离线部署)
linux·深度学习·ubuntu·docker·容器·nlp·ocr
子时不睡10 小时前
【Datawhale AI 夏令营】 用AI做带货视频评论分析(一)
人工智能·深度学习·音视频
阿里云大数据AI技术10 小时前
云上AI推理平台全掌握 (3):服务接入与全球调度
大数据·人工智能·深度学习
大千AI助手11 小时前
TinyBERT:知识蒸馏驱动的BERT压缩革命 | 模型小7倍、推理快9倍的轻量化引擎
人工智能·深度学习·机器学习·自然语言处理·bert·蒸馏·tinybert