一文读懂人工智能,机器学习,深度学习,神经网络,Transformer

目录

    • [一、逐个定义 + 各自包含内容](#一、逐个定义 + 各自包含内容)
      • [1. 人工智能 AI(最大范畴)](#1. 人工智能 AI(最大范畴))
      • [2. 机器学习 ML(AI 的子集,实现AI的主流方法)](#2. 机器学习 ML(AI 的子集,实现AI的主流方法))
      • [3. 深度学习 DL(机器学习的子集)](#3. 深度学习 DL(机器学习的子集))
      • [4. 神经网络 NN(深度学习的底层载体)](#4. 神经网络 NN(深度学习的底层载体))
      • [5. Transformer(神经网络里的一种具体结构)](#5. Transformer(神经网络里的一种具体结构))
    • 二、层级从属关系(核心链条,必记)
    • 三、通俗大白话关联
    • 四、极简一句话总结

一、逐个定义 + 各自包含内容

1. 人工智能 AI(最大范畴)

定义 :让机器具备感知、推理、决策、理解、创造 等类人智能的技术总称。
包含内容

  1. 传统人工智能(非机器学习)
  • 符号推理、规则系统、专家系统、搜索算法、博弈算法
  • 知识图谱(规则推理)、自动逻辑证明
  1. 现代人工智能(机器学习方向)
  • 传统机器学习
  • 深度学习
  1. 其他分支
  • 模糊控制、进化算法(遗传算法)、机器人控制、多智能体

2. 机器学习 ML(AI 的子集,实现AI的主流方法)

定义 :不硬写死规则,让机器从数据中自动学规律 ,从而完成预测、分类、决策。
包含内容

  1. 传统机器学习(非神经网络)
  • 回归:线性回归、岭回归
  • 分类:逻辑回归、SVM、朴素贝叶斯、KNN
  • 聚类:K-Means、DBSCAN
  • 树与集成:决策树、随机森林、XGBoost、LightGBM
  • 降维:PCA
  1. 深度学习(机器学习的子集)
  • 各种神经网络模型与训练方法

3. 深度学习 DL(机器学习的子集)

定义 :利用多层堆叠的深度神经网络 ,自动提取高阶特征,处理复杂大数据。
包含内容

  1. 各类神经网络架构
  • MLP全连接网络
  • CNN卷积网络(图像)
  • RNN/LSTM/GRU(早期时序、文本)
  • GAN、VAE(生成模型)
  • GNN图神经网络
  • Transformer(大模型、多模态核心)
  • 新架构:Mamba、RetNet
  1. 配套技术
  • 预训练、微调、批量归一化、优化器、反向传播、RLHF

4. 神经网络 NN(深度学习的底层载体)

定义 :模仿人脑神经元连接,由多层节点+权重 组成的计算网络。
包含内容

  1. 基础结构:神经元、激活函数、隐藏层、全连接层
  2. 经典网络结构
  • MLP 全连接神经网络
  • CNN 卷积神经网络
  • RNN 循环神经网络
  • LSTM/GRU
  • GNN、GAN
  • Transformer

本质:所有深度学习 = 训练各种深层神经网络


5. Transformer(神经网络里的一种具体结构)

定义 :2017年提出,以自注意力机制 为核心的新型神经网络结构。
包含/衍生内容

  • 核心组件:自注意力、多头注意力、前馈网络、位置编码
  • 三大范式:
    • Encoder 双向:BERT类(理解)
    • Decoder 自回归:GPT、Claude、千问、DeepSeek(生成)
    • Encoder+Decoder:翻译、多任务
  • 优化变种:MoE混合专家、长文本Transformer、多模态Transformer

二、层级从属关系(核心链条,必记)

\\boldsymbol{人工智能 \\supset 机器学习 \\supset 深度学习 \\supset 神经网络 \\supset Transformer}

  1. AI 包含一切智能技术(规则AI + 机器学习)
  2. 机器学习是AI的一大分支,靠数据学习
  3. 深度学习是机器学习的子集,用深层网络
  4. 神经网络是深度学习的基础骨架
  5. Transformer 只是众多神经网络中的一种(现在最强、做大模型专用)

三、通俗大白话关联

  1. 人工智能:最大筐,只要机器变聪明都算
  2. 机器学习:不用写死规则,靠数据自己学
  3. 深度学习:层数非常多的"高级神经网络学习"
  4. 神经网络:一套模仿人脑的计算网络(深度学习的容器)
  5. Transformer
    神经网络里最适合文本、长上下文、通用智能 的一款结构;
    现在所有大模型:ChatGPT、Claude、Gemini、通义千问、DeepSeek 全部基于它。

四、极简一句话总结

  • AI:范围最大
  • 机器学习:AI里"靠数据学习"的路线
  • 深度学习:机器学习里"用深层神经网络"的路线
  • 神经网络:深度学习的模型本体
  • Transformer:神经网络中,当前大模型的核心底座。
相关推荐
Szime3 分钟前
靠谱的终端工厂采购电子元器件供应链哪家更适合研发型企业?
人工智能·python
圣殿骑士-Khtangc5 分钟前
SuperSplat 架构深度解析:8.2K Star 的浏览器端 3D 高斯泼溅编辑器,PlayCanvas 如何用纯 WebGL 重新定义三维内容工作流
人工智能
Mem0rin6 分钟前
[Agent基础]Agent、消息和聊天模板
人工智能·transformer
智信中科张炜7 分钟前
全球及中国二板注塑机市场前景形势分析报告
人工智能
升鲜宝供应链及收银系统源代码服务8 分钟前
升鲜宝 AI 供应链分析方案业务分析、智能预警与实施落地方案(一)---升鲜宝生鲜配送供应链管理系统源代码服务
人工智能·生鲜供应链源代码·供应链源代码出售·生鲜配送源代码服务·猪肉生产加工系统源代码·生鲜供应链系统·生鲜配送系统ai应用
编程牛马姐10 分钟前
爬虫开发工具测评:Playwright vs Puppeteer
人工智能
andafaAPS13 分钟前
安达发|aps高级排产:电动工具行业智能制造的核心引擎
大数据·人工智能·制造·安达发aps·aps高级排产·aps自动排产
大模型最新论文速读15 分钟前
05-29 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
杀生丸学AI16 分钟前
【三维重建】RT-Splatting:基于3DGS的联合反射-透射建模(CVPR 2026)
人工智能·深度学习·3d·三维重建·高斯泼溅·动态重建·镜面反射
STRUGGLE_xlf20 分钟前
Codex × PPT Skill:一句话生成演示文稿
人工智能·powerpoint·智能体