一文读懂人工智能,机器学习,深度学习,神经网络,Transformer

目录

    • [一、逐个定义 + 各自包含内容](#一、逐个定义 + 各自包含内容)
      • [1. 人工智能 AI(最大范畴)](#1. 人工智能 AI(最大范畴))
      • [2. 机器学习 ML(AI 的子集,实现AI的主流方法)](#2. 机器学习 ML(AI 的子集,实现AI的主流方法))
      • [3. 深度学习 DL(机器学习的子集)](#3. 深度学习 DL(机器学习的子集))
      • [4. 神经网络 NN(深度学习的底层载体)](#4. 神经网络 NN(深度学习的底层载体))
      • [5. Transformer(神经网络里的一种具体结构)](#5. Transformer(神经网络里的一种具体结构))
    • 二、层级从属关系(核心链条,必记)
    • 三、通俗大白话关联
    • 四、极简一句话总结

一、逐个定义 + 各自包含内容

1. 人工智能 AI(最大范畴)

定义 :让机器具备感知、推理、决策、理解、创造 等类人智能的技术总称。
包含内容

  1. 传统人工智能(非机器学习)
  • 符号推理、规则系统、专家系统、搜索算法、博弈算法
  • 知识图谱(规则推理)、自动逻辑证明
  1. 现代人工智能(机器学习方向)
  • 传统机器学习
  • 深度学习
  1. 其他分支
  • 模糊控制、进化算法(遗传算法)、机器人控制、多智能体

2. 机器学习 ML(AI 的子集,实现AI的主流方法)

定义 :不硬写死规则,让机器从数据中自动学规律 ,从而完成预测、分类、决策。
包含内容

  1. 传统机器学习(非神经网络)
  • 回归:线性回归、岭回归
  • 分类:逻辑回归、SVM、朴素贝叶斯、KNN
  • 聚类:K-Means、DBSCAN
  • 树与集成:决策树、随机森林、XGBoost、LightGBM
  • 降维:PCA
  1. 深度学习(机器学习的子集)
  • 各种神经网络模型与训练方法

3. 深度学习 DL(机器学习的子集)

定义 :利用多层堆叠的深度神经网络 ,自动提取高阶特征,处理复杂大数据。
包含内容

  1. 各类神经网络架构
  • MLP全连接网络
  • CNN卷积网络(图像)
  • RNN/LSTM/GRU(早期时序、文本)
  • GAN、VAE(生成模型)
  • GNN图神经网络
  • Transformer(大模型、多模态核心)
  • 新架构:Mamba、RetNet
  1. 配套技术
  • 预训练、微调、批量归一化、优化器、反向传播、RLHF

4. 神经网络 NN(深度学习的底层载体)

定义 :模仿人脑神经元连接,由多层节点+权重 组成的计算网络。
包含内容

  1. 基础结构:神经元、激活函数、隐藏层、全连接层
  2. 经典网络结构
  • MLP 全连接神经网络
  • CNN 卷积神经网络
  • RNN 循环神经网络
  • LSTM/GRU
  • GNN、GAN
  • Transformer

本质:所有深度学习 = 训练各种深层神经网络


5. Transformer(神经网络里的一种具体结构)

定义 :2017年提出,以自注意力机制 为核心的新型神经网络结构。
包含/衍生内容

  • 核心组件:自注意力、多头注意力、前馈网络、位置编码
  • 三大范式:
    • Encoder 双向:BERT类(理解)
    • Decoder 自回归:GPT、Claude、千问、DeepSeek(生成)
    • Encoder+Decoder:翻译、多任务
  • 优化变种:MoE混合专家、长文本Transformer、多模态Transformer

二、层级从属关系(核心链条,必记)

\\boldsymbol{人工智能 \\supset 机器学习 \\supset 深度学习 \\supset 神经网络 \\supset Transformer}

  1. AI 包含一切智能技术(规则AI + 机器学习)
  2. 机器学习是AI的一大分支,靠数据学习
  3. 深度学习是机器学习的子集,用深层网络
  4. 神经网络是深度学习的基础骨架
  5. Transformer 只是众多神经网络中的一种(现在最强、做大模型专用)

三、通俗大白话关联

  1. 人工智能:最大筐,只要机器变聪明都算
  2. 机器学习:不用写死规则,靠数据自己学
  3. 深度学习:层数非常多的"高级神经网络学习"
  4. 神经网络:一套模仿人脑的计算网络(深度学习的容器)
  5. Transformer
    神经网络里最适合文本、长上下文、通用智能 的一款结构;
    现在所有大模型:ChatGPT、Claude、Gemini、通义千问、DeepSeek 全部基于它。

四、极简一句话总结

  • AI:范围最大
  • 机器学习:AI里"靠数据学习"的路线
  • 深度学习:机器学习里"用深层神经网络"的路线
  • 神经网络:深度学习的模型本体
  • Transformer:神经网络中,当前大模型的核心底座。
相关推荐
jooloo1 小时前
Codex 间歇性 400 之谜:一条对话里,它为什么有时候用 chat/completions,有时候切到 responses?
人工智能
用户5191495848451 小时前
OpenSSL PKCS#12 PBMAC1 堆栈缓冲区溢出漏洞 (CVE-2025-11187) 分析与验证
人工智能·aigc
用户5191495848453 小时前
HP Sound Research SECOMNService 权限提升漏洞利用工具
人工智能·aigc
用户018349301693 小时前
给 AI 智能体能力包一层 BFF,前端只调一个接口
人工智能
这token有力气6 小时前
Function Calling 格式漂移
人工智能
onething3656 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 5 —— SSE 流式输出 + 打字机效果
人工智能·后端·全栈
onething3657 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 6 —— 业务完善 + 会话消息预览
人工智能·后端·全栈
IT_陈寒7 小时前
SpringBoot自动配置的坑,我爬了三天才出来
前端·人工智能·后端
甲维斯9 小时前
笑抽了!DeepSeek识图,豆包完胜了!
人工智能·deepseek
Lei活在当下17 小时前
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南
人工智能·llm·openai