人工智能100问☞第22问：什么是卷积神经网络（CNN）？

卷积神经网络（CNN）是一种通过卷积核扫描局部区域、参数共享和分层特征提取的深度学习模型，专为高效处理图像、语音等网格化数据设计，可直接从原始输入中自动学习关键特征。

CNN的工作方式像一套"智能图像分析流水线"：

放大镜找细节：卷积层如同多个放大镜（卷积核），每个放大镜专门捕捉特定局部特征，比如猫的胡须或车轮纹理。

压缩关键信息：池化层像"信息过滤器"，将重复的细节（如背景色块）压缩成核心线索（如"车轮是圆形"），即使图片旋转或缩放也能识别。

层层组装答案：低层先识别"边缘和色块"，中层组合成"轮胎和车窗"，高层判断这是"一辆汽车"，模仿人类从局部到整体的认知逻辑。

CNN的架构基于三大核心机制：

1 、 局部连接与参数共享

卷积核在输入数据上滑动，仅连接局部区域（感受野），同一核权重全局共享，极大减少参数量的同时保留空间结构信息。例如，3×3卷积核在图像中遍历提取边缘、纹理等基础特征。

2 、层次化特征抽象

低层卷积层捕获颜色、边缘等低级特征，深层网络通过堆叠卷积-池化层融合出物体部件、整体形态等高级语义，形成端到端的特征表达体系。

3 、平移不变性与降维

池化层（如最大池化）通过下采样降低特征图维度，赋予模型对目标位置偏移的鲁棒性；批量归一化层则加速训练收敛并缓解过拟合

1 、Yann LeCun （CNN 领域先驱，纽约大学教授）

卷积神经网络 (CNN) 是一类神经网络，它使用卷积运算从输入数据（通常是图像）中提取特征，旨在利用数据的 2D 结构，通过共享权重实现平移不变性。

2 、NVIDIA

卷积神经网络 (CNN) 是一种深度学习网络，主要用于识别和分类图像以及识别图像中的物体。这种深度学习网络在图像数据映射方面可提供最佳结果，并且具有很高的计算效率。

3 、IBM

卷积神经网络使用三维数据进行图像分类和物体识别任务。它们主要包含三种类型的层：卷积层、池化层和全连接层，它们协同工作以识别图像中的模式。