深度学习四大核心架构:神经网络(NN)、卷积神经网络(CNN)、循环神经网络(RNN)与Transformer全概述

🌰 知识点概述


🧠 核心区别对比表

特性 NN(全连接网络) CNN(卷积网络) RNN(循环网络) Transformer
输入类型 固定长度的结构化数据(如表格) 网格状数据(图像/音频) 时序数据(文本/时间序列) 长序列数据(文本/语音)
核心结构 全连接层 卷积层 + 池化层 循环单元(LSTM/GRU) 自注意力机制 + 位置编码
参数共享 ❌ 无 ✅ 卷积核共享(空间局部性) ✅ 循环权重共享(时序共享) ✅ 注意力权重动态分配
时序依赖处理 ❌ 忽略时序关系 ❌ 仅局部空间关系 ✅ 顺序处理(短期记忆依赖) 全局依赖(并行计算)
典型应用 房价预测/简单分类 图像分类/目标检测 文本生成/股票预测 机器翻译/文本摘要(如BERT)
训练效率 低效(参数爆炸) 高效(参数共享) 低效(顺序计算) 高效(并行计算)但内存消耗大
长序列处理 ❌ 不支持 ❌ 不支持 ❌ 梯度消失/遗忘早期信息 ✅ 自注意力直接关联任意位置
关键创新 基础神经元模型 局部感知/权重共享 时间步状态传递 多头注意力 + 位置编码

生活化案例理解

  1. NN

    类比 :盲人摸象,每个神经元独立感知全局特征

    局限:输入图像需展平为向量,丢失空间信息(如将28x28图片变成784维向量)

  2. CNN

    类比 :人类视觉系统,先识别边缘→形状→物体

    实战:用3x3卷积核扫描猫的图片,提取耳朵、胡须等局部特征

  3. RNN

    类比 :阅读理解,需记住前文才能理解后文

    痛点:输入句子"The cat sat on the mat",到第6个单词时可能已遗忘"cat"

  4. Transformer

    类比 :团队协作,每个单词直接关注全局上下文

    优势:处理句子"I arrived at the bank after crossing the river"时,"bank"可同时关注"river"(消除歧义)


🔑 选型指南

场景 推荐模型 理由
表格数据分类/回归 NN 结构简单,无需复杂特征提取
图像识别/目标检测 CNN 高效捕捉空间局部特征
短文本生成/时间序列预测 RNN(LSTM/GRU) 处理简单时序依赖
长文本翻译/文档摘要 Transformer 捕捉长距离依赖,并行计算高效
多模态数据(如图文匹配) Transformer+CNN 联合处理文本和图像特征
相关推荐
mCell5 小时前
长期以来我对 LLM 的误解
深度学习·llm·ollama
_pinnacle_6 小时前
打开神经网络的黑箱(三) 卷积神经网络(CNN)的模型逻辑
人工智能·神经网络·cnn·黑箱·卷积网络
Ada's6 小时前
深度学习在自动驾驶上应用(二)
人工智能·深度学习·自动驾驶
机器学习之心8 小时前
198种组合算法+优化BiLSTM神经网络+SHAP分析+新数据预测+多输出!深度学习可解释分析,强烈安利,粉丝必备!
深度学习·神经网络·shap分析·新数据预测·198种组合算法·优化bilstm神经网络·多输出
charieli-fh8 小时前
指令微调数据评估与影响:构建高质量大语言模型的关键
人工智能·深度学习·语言模型
Coovally AI模型快速验证8 小时前
从避障到实时建图:机器学习如何让无人机更智能、更安全、更实用(附微型机载演示示例)
人工智能·深度学习·神经网络·学习·安全·机器学习·无人机
没有梦想的咸鱼185-1037-16639 小时前
【遥感技术】从CNN到Transformer:基于PyTorch的遥感影像、无人机影像的地物分类、目标检测、语义分割和点云分类
pytorch·python·深度学习·机器学习·数据分析·cnn·transformer
钟爱蛋炒饭9 小时前
基于深度学习神经网络协同过滤模型(NCF)的视频推荐系统
python·神经网络·机器学习
cyyt9 小时前
深度学习周报(9.15~9.21)
人工智能·深度学习·量子计算
红苕稀饭66611 小时前
VideoChat-Flash论文阅读
人工智能·深度学习·机器学习