每天五分钟计算机视觉:使用1*1卷积层来改变输入层的通道数量

本文重点

在卷积神经网络中有很多重要的卷积核,比如1*1的卷积核,3*3的卷积核,本文将讲解1*1的卷积核的使用,它在卷积神经网络中具有重要的地位。由于1*1的卷积核使用了最小的窗口,那么1*1的卷积核就失去了卷积层可以识别高和宽维度上相邻元素构成的模式的功能。所以1*1的卷积核的主要计算发生在通道维上。

使用1*1卷积完成通道压缩

对于一个 28×28×192 的输入层,我们可以使用池化层压缩它的高度和宽度 ,但如果通道数量很大,如何才能压缩通道呢?

该如何把28×28×192压缩为 28×28×32 维度呢?你可以用 32个大小为 1×1×192 的过滤器,也就是说你使用了 32 个过滤器,输出层为 28×28×32,这就是压缩通道数(nc)的方法。

我们可以认为1×1 卷积只是添加了非线性函数,所以让网络学习更复杂的函数,我们可以再添加一层使用192个大小为 1×1*192的过滤器,其输入为 28×28×192,输出为 28×28×192。这样输入和输出的维度是一样的,都是28×28×192,但是后面的输出比前面的输入可以认为提取到了更加复杂的特征。

相关推荐
熙梦数字化几秒前
企业资源计划(ERP)系统是什么?有哪些特点?
大数据·人工智能·erp
GISer_Jing3 分钟前
SSE Conf大会分享——大模型驱动的智能 可视分析与故事叙述
前端·人工智能·信息可视化
Wai-Ngai6 分钟前
自动驾驶控制算法——模型预测控制(MPC)
人工智能·机器学习·自动驾驶
北京耐用通信7 分钟前
突破协议壁垒:耐达讯自动化Ethernet/IP转CC-Link网关在工业互联中的核心应用
人工智能·网络协议·安全·自动化·信息与通信
提娜米苏7 分钟前
[论文笔记] 基于 LSTM 的端到端视觉语音识别 (End-to-End Visual Speech Recognition with LSTMs)
论文阅读·深度学习·计算机视觉·lstm·语音识别·视觉语音识别
扫描电镜7 分钟前
扫描电镜选购指南:智能、稳定与自动化的综合考量
人工智能·自动化·扫描电镜·自动扫描电镜
AI人工智能+8 分钟前
炫彩活体检测技术:利用RGB色光序列检测用户面部生物特征反应,能有效识别3D面具、Deepfake等伪造攻击
人工智能·人脸识别·炫彩活体检测
无代码专家10 分钟前
数字化转型下的订单管理全流程优化方案
大数据·运维·人工智能
QianCenRealSim13 分钟前
FSD入华“加速”中国自动驾驶产业的推动与重构
人工智能·重构·自动驾驶
roman_日积跬步-终至千里14 分钟前
【模式识别与机器学习(1+)】基础概念之:机器学习基础
人工智能·机器学习