人工智能、机器学习、生成式AI、神经网络、Transformer 概念梳理
一、整体层级关系
范围从大到小:人工智能(AI) ⊃ 机器学习(ML) ⊃ 神经网络(NN) ⊃ 生成式AI
Transformer 是神经网络中的经典架构,也是当前生成式AI的核心底座。
二、各概念详解
1. 人工智能(AI)
- 定义:让机器模拟、延伸人类智能的技术总称,目标是实现感知、思考、判断、行动。并非单一算法,而是一整个技术领域。
- 包含范围:传统规则编程、机器学习、计算机视觉、语音识别、大模型、机器人等。
- 举例:人脸识别、语音助手、自动驾驶、智能聊天机器人。
- 通俗理解:所有"让机器变聪明"的技术合集。
2. 机器学习(ML)
- 定义 :人工智能的主流实现方式。区别于手动编写固定规则,机器依托海量数据自主学习规律、生成逻辑。
- 核心思想:从数据中自动提炼模式,替代人工逐条定义业务逻辑。
- 主要分类
- 监督学习:基于带标签数据,用于分类、预测
- 无监督学习:基于无标签数据,用于聚类、异常检测
- 强化学习:通过不断试错学习,多用于游戏AI、机器人控制
- 通俗理解:让机器依靠数据"自学成才"的AI技术。
3. 神经网络(NN)
- 定义 :模仿人脑神经元结构设计的机器学习模型,是深度学习的基础。由输入层、隐藏层、输出层组成,多层堆叠即深度神经网络(深度学习)。
- 工作流程:输入数据 → 多层神经元提取特征、运算 → 输出结果。
- 常见类型
- 全连接网络:基础模型
- CNN卷积神经网络:主打图像、视觉任务
- RNN/LSTM循环神经网络:早期用于文本、序列数据
- Transformer:当下主流通用神经网络架构
- 通俗理解:模仿人脑运作的智能模型,深度学习就是层数更多的神经网络。
4. 生成式人工智能(生成式AI)
- 定义 :以创作全新内容为目标的AI,与传统判别式AI(识别、分类、判断)相对。
- 核心特点:学习数据内在规律后,生成逻辑通顺、从未出现过的新内容,而非简单复制。
- 主流应用
- 文本生成:大语言模型、对话机器人、文案创作
- 图像生成:文生图、图生图
- 多模态生成:图文、音视频创作
- 关联关系:目前主流生成式AI,底层均为基于Transformer的深度神经网络。
- 通俗理解:具备"创作能力"的AI,可写文、画图、生成音视频等。
5. Transformer 架构
- 定位:2017年提出的神经网络架构,论文《Attention Is All You Need》,是现代大模型、生成式AI的核心骨架。
- 核心创新 :自注意力机制,处理序列数据时,能全局关联所有信息,重点抓取关键内容,解决了传统模型长文本遗忘、计算缓慢的问题。
- 两大核心模块
- 编码器(Encoder):侧重语义理解、分析、翻译、分类
- 解码器(Decoder):侧重内容逐一生成,主流大语言模型多采用纯解码器架构
- 核心优势:支持并行计算、擅长超长文本处理、易于扩容,参数与层数提升后能力大幅增强。
- 应用现状:GPT、LLaMA、各类国产大模型等主流生成式模型,均基于该架构。
- 通俗理解:现阶段性能最强的神经网络"骨架",几乎所有顶尖AI大模型都基于它搭建。
三、完整逻辑串联
- 人工智能是最大的技术领域;
- 机器学习是实现人工智能最核心的手段;
- 神经网络是机器学习里模仿人脑的高效模型,深度学习就是深层神经网络;
- Transformer 是目前综合能力最强的神经网络架构;
- 生成式AI是偏向内容创作的AI方向,当下主流产品均依托Transformer架构实现。
四、极简速记
- AI:机器智能化的统称
- 机器学习:机器靠数据自主学习
- 神经网络:仿人脑的学习模型
- Transformer:主流神经网络核心架构(注意力机制)
- 生成式AI:基于Transformer大模型实现内容创作