深度学习四大核心架构:神经网络(NN)、卷积神经网络(CNN)、循环神经网络(RNN)与Transformer全概述

🌰 知识点概述


🧠 核心区别对比表

特性 NN(全连接网络) CNN(卷积网络) RNN(循环网络) Transformer
输入类型 固定长度的结构化数据(如表格) 网格状数据(图像/音频) 时序数据(文本/时间序列) 长序列数据(文本/语音)
核心结构 全连接层 卷积层 + 池化层 循环单元(LSTM/GRU) 自注意力机制 + 位置编码
参数共享 ❌ 无 ✅ 卷积核共享(空间局部性) ✅ 循环权重共享(时序共享) ✅ 注意力权重动态分配
时序依赖处理 ❌ 忽略时序关系 ❌ 仅局部空间关系 ✅ 顺序处理(短期记忆依赖) 全局依赖(并行计算)
典型应用 房价预测/简单分类 图像分类/目标检测 文本生成/股票预测 机器翻译/文本摘要(如BERT)
训练效率 低效(参数爆炸) 高效(参数共享) 低效(顺序计算) 高效(并行计算)但内存消耗大
长序列处理 ❌ 不支持 ❌ 不支持 ❌ 梯度消失/遗忘早期信息 ✅ 自注意力直接关联任意位置
关键创新 基础神经元模型 局部感知/权重共享 时间步状态传递 多头注意力 + 位置编码

生活化案例理解

  1. NN

    类比 :盲人摸象,每个神经元独立感知全局特征

    局限:输入图像需展平为向量,丢失空间信息(如将28x28图片变成784维向量)

  2. CNN

    类比 :人类视觉系统,先识别边缘→形状→物体

    实战:用3x3卷积核扫描猫的图片,提取耳朵、胡须等局部特征

  3. RNN

    类比 :阅读理解,需记住前文才能理解后文

    痛点:输入句子"The cat sat on the mat",到第6个单词时可能已遗忘"cat"

  4. Transformer

    类比 :团队协作,每个单词直接关注全局上下文

    优势:处理句子"I arrived at the bank after crossing the river"时,"bank"可同时关注"river"(消除歧义)


🔑 选型指南

场景 推荐模型 理由
表格数据分类/回归 NN 结构简单,无需复杂特征提取
图像识别/目标检测 CNN 高效捕捉空间局部特征
短文本生成/时间序列预测 RNN(LSTM/GRU) 处理简单时序依赖
长文本翻译/文档摘要 Transformer 捕捉长距离依赖,并行计算高效
多模态数据(如图文匹配) Transformer+CNN 联合处理文本和图像特征
相关推荐
<-->9 小时前
Megatron(全称 Megatron-LM,由 NVIDIA 开发)和 DeepSpeed(由 Microsoft 开发)
人工智能·pytorch·python·深度学习·transformer
Yuanxl9039 小时前
神经网络-Sequential 应用与实战
人工智能·深度学习·神经网络
真·skysys12 小时前
On-Policy Distillation
人工智能·深度学习·机器学习
AI医影跨模态组学15 小时前
Cancer Letters(IF=10.1)中科院自动化研究所田捷等团队:整合纵向MRI与活检全切片图像用于乳腺癌新辅助治疗反应的早期预测及个体化管理
人工智能·深度学习·论文·医学·医学影像
王飞飞不会飞15 小时前
Mac 安装Hermes Agent 过程记录
运维·深度学习·机器学习
是梦终空15 小时前
计算机毕业设计271—基于python+深度学习+YOLOV7的车牌识别系统(源代码+数据库+3万字论文)
python·深度学习·opencv·yolo·毕业设计·pyqt5·车牌识别系统
天一生水water16 小时前
CNN循环神经网络关键知识点
人工智能·rnn·cnn
沅_Yuan17 小时前
基于高斯径向基函数GRBF的多输入单输出神经网络模型【MATLAB】
神经网络·matlab·多输入单输出·rbf·高斯·grbf
金融小师妹17 小时前
多因子情景推演模型:霍尔木兹扰动下的全球资产再定价与波动率重构
深度学习·svn·逻辑回归·能源
数据门徒17 小时前
神经网络核心概念 全景梳理与关系图谱
人工智能·深度学习·神经网络