深度学习四大核心架构:神经网络(NN)、卷积神经网络(CNN)、循环神经网络(RNN)与Transformer全概述

🌰 知识点概述


🧠 核心区别对比表

特性 NN(全连接网络) CNN(卷积网络) RNN(循环网络) Transformer
输入类型 固定长度的结构化数据(如表格) 网格状数据(图像/音频) 时序数据(文本/时间序列) 长序列数据(文本/语音)
核心结构 全连接层 卷积层 + 池化层 循环单元(LSTM/GRU) 自注意力机制 + 位置编码
参数共享 ❌ 无 ✅ 卷积核共享(空间局部性) ✅ 循环权重共享(时序共享) ✅ 注意力权重动态分配
时序依赖处理 ❌ 忽略时序关系 ❌ 仅局部空间关系 ✅ 顺序处理(短期记忆依赖) 全局依赖(并行计算)
典型应用 房价预测/简单分类 图像分类/目标检测 文本生成/股票预测 机器翻译/文本摘要(如BERT)
训练效率 低效(参数爆炸) 高效(参数共享) 低效(顺序计算) 高效(并行计算)但内存消耗大
长序列处理 ❌ 不支持 ❌ 不支持 ❌ 梯度消失/遗忘早期信息 ✅ 自注意力直接关联任意位置
关键创新 基础神经元模型 局部感知/权重共享 时间步状态传递 多头注意力 + 位置编码

生活化案例理解

  1. NN

    类比 :盲人摸象,每个神经元独立感知全局特征

    局限:输入图像需展平为向量,丢失空间信息(如将28x28图片变成784维向量)

  2. CNN

    类比 :人类视觉系统,先识别边缘→形状→物体

    实战:用3x3卷积核扫描猫的图片,提取耳朵、胡须等局部特征

  3. RNN

    类比 :阅读理解,需记住前文才能理解后文

    痛点:输入句子"The cat sat on the mat",到第6个单词时可能已遗忘"cat"

  4. Transformer

    类比 :团队协作,每个单词直接关注全局上下文

    优势:处理句子"I arrived at the bank after crossing the river"时,"bank"可同时关注"river"(消除歧义)


🔑 选型指南

场景 推荐模型 理由
表格数据分类/回归 NN 结构简单,无需复杂特征提取
图像识别/目标检测 CNN 高效捕捉空间局部特征
短文本生成/时间序列预测 RNN(LSTM/GRU) 处理简单时序依赖
长文本翻译/文档摘要 Transformer 捕捉长距离依赖,并行计算高效
多模态数据(如图文匹配) Transformer+CNN 联合处理文本和图像特征
相关推荐
2301_764441339 分钟前
基于神经网络的肾脏疾病预测模型
人工智能·深度学习·神经网络
HABuo31 分钟前
【YOLOv8】YOLOv8改进系列(12)----替换主干网络之StarNet
人工智能·深度学习·yolo·目标检测·计算机视觉
Dovis(誓平步青云)1 小时前
深挖 DeepSeek 隐藏玩法·智能炼金术2.0版本
人工智能·深度学习·机器学习·数据挖掘·服务发现·智慧城市
赵钰老师2 小时前
【Deepseek、ChatGPT】智能气候前沿:AI Agent结合机器学习与深度学习在全球气候变化驱动因素预测中的应用
人工智能·python·深度学习·机器学习·数据分析
Start_Present4 小时前
Pytorch 第十三回:神经网络编码器——自动编解码器
pytorch·python·深度学习·神经网络
Y1nhl5 小时前
搜广推校招面经六十四
人工智能·深度学习·leetcode·广告算法·推荐算法·搜索算法
Y1nhl6 小时前
Pyspark学习一:概述
数据库·人工智能·深度学习·学习·spark·pyspark·大数据技术
简简单单做算法8 小时前
基于mediapipe深度学习和限定半径最近邻分类树算法的人体摔倒检测系统python源码
人工智能·python·深度学习·算法·分类·mediapipe·限定半径最近邻分类树
就决定是你啦!9 小时前
机器学习 第一章 绪论
人工智能·深度学习·机器学习
liruiqiang0512 小时前
循环神经网络 - 简单循环网络
人工智能·rnn·深度学习·神经网络·机器学习