常见的卷积神经网络列举

经典的卷积神经网络(CNN)在深度学习发展史上具有重要地位,以下是一些里程碑式的模型及其核心贡献:


1. LeNet-5(1998)

  • 提出者:Yann LeCun
  • 特点
    • 首个成功应用于手写数字识别(MNIST)的CNN。
    • 结构:卷积层 + 池化层(当时用Subsampling) + 全连接层。
    • 使用Tanh激活函数,后续被ReLU取代。
  • 意义:奠定了CNN的基本结构。

2. AlexNet(2012)

  • 提出者:Alex Krizhevsky 等(Geoffrey Hinton团队)
  • 特点
    • 赢得ImageNet竞赛(ILSVRC 2012),top-5错误率大幅降低至15.3%。
    • 引入ReLU激活函数解决梯度消失。
    • 使用Dropout防止过拟合。
    • 首次采用GPU加速训练(双GPU并行)。
  • 意义:开启CNN在计算机视觉的黄金时代。

3. VGGNet(2014)

  • 提出者:牛津大学Visual Geometry Group
  • 特点
    • 核心思想:小卷积核(3×3)堆叠替代大卷积核,减少参数并增强非线性。
    • 常用版本:VGG-16 和 VGG-19(数字代表层数)。
    • 结构规整,易于迁移学习。
  • 意义:证明了深度的重要性,设计理念影响后续模型。

4. GoogLeNet(Inception v1, 2014)

  • 提出者:Google团队
  • 特点
    • 提出Inception模块:并行多尺度卷积(1×1、3×3、5×5)和池化,通过1×1卷积降维。
    • 引入辅助分类器缓解梯度消失。
    • 参数量仅为AlexNet的1/12,效率极高。
  • 后续改进:Inception v2/v3(BN、分解卷积)、v4(结合ResNet)。

5. ResNet(2015)

  • 提出者:何恺明等(Microsoft Research)
  • 特点
    • 残差连接(Residual Block):解决深层网络梯度消失问题,允许训练超过1000层的网络。
    • 赢得ILSVRC 2015,top-5错误率3.57%(超越人类水平)。
    • 变体:ResNeXt(分组卷积)、DenseNet(密集连接)。
  • 意义:成为现代CNN的基础结构。

6. 其他重要变体

  • MobileNet(2017):深度可分离卷积,轻量化设计。
  • EfficientNet(2019):复合缩放(深度/宽度/分辨率平衡)。
  • SENet(2017):通道注意力机制(Squeeze-and-Excitation模块)。

总结

模型 核心贡献 应用场景
LeNet-5 首个CNN结构 手写数字识别
AlexNet ReLU/Dropout/GPU训练 大规模图像分类
VGGNet 小卷积核堆叠 迁移学习基础
GoogLeNet Inception多尺度模块 高效计算
ResNet 残差连接解决深度问题 极深层网络设计

这些模型推动了CNN在图像分类、目标检测(如Faster R-CNN)、语义分割(如U-Net)等任务中的应用。

相关推荐
ningmengjing_5 分钟前
理解损失函数:机器学习的指南针与裁判
人工智能·深度学习·机器学习
程序猿炎义20 分钟前
【NVIDIA AIQ】自定义函数实践
人工智能·python·学习
小陈phd33 分钟前
高级RAG策略学习(四)——上下文窗口增强检索RAG
人工智能·学习·langchain
居然JuRan1 小时前
阿里云多模态大模型岗三面面经
人工智能
THMAIL1 小时前
深度学习从入门到精通 - BERT与预训练模型:NLP领域的核弹级技术详解
人工智能·python·深度学习·自然语言处理·性能优化·bert
nju_spy1 小时前
Kaggle - LLM Science Exam 大模型做科学选择题
人工智能·机器学习·大模型·rag·南京大学·gpu分布计算·wikipedia 维基百科
中國龍在廣州1 小时前
GPT-5冷酷操盘,游戏狼人杀一战封神!七大LLM狂飙演技,人类玩家看完沉默
人工智能·gpt·深度学习·机器学习·计算机视觉·机器人
东哥说-MES|从入门到精通1 小时前
Mazak MTF 2025制造未来参观总结
大数据·网络·人工智能·制造·智能制造·数字化
CodeCraft Studio1 小时前
Aspose.Words for .NET 25.7:支持自建大语言模型(LLM),实现更安全灵活的AI文档处理功能
人工智能·ai·语言模型·llm·.net·智能文档处理·aspose.word
山烛2 小时前
深度学习:CNN 模型训练中的学习率调整(基于 PyTorch)
人工智能·pytorch·python·深度学习·cnn·调整学习率