【系统分析师_知识点整理】 3.数据库系统

**核心考向：**数据库系统组成与体系结构、三级模式两级映像（逻辑 / 物理独立性为选择题高频）、数据库设计五阶段（E-R 模型设计与转换为案例题重点）、关系代数运算（并交差笛卡尔积 / 自然连接为计算题高频）、规范化理论（范式判定 / 模式分解为核心难点，选择 + 案例均常考）、事务管理（ACID 特性 / 并发问题 / 封锁协议）、数据库安全与恢复（故障处理 / 备份类型）、分布式数据库（分片模式 / 分布透明性）、数据仓库与数据挖掘、非关系数据库（NoSQL 分类 / CAP/BASE）、SQL 语法（增删改查 / 授权收回）；第二版新增 θ 连接 / 等值连接 / 除法运算 / 元组演算、4NF、数据恢复、性能优化、分布式数据库分片、数据仓库分类设计、数据挖掘、非关系数据库为考查重点，删除大数据知识点，扩展补充内容几乎不考无需深究。

**解题关键：**概念辨析清晰（三级模式 / 各种范式 / 锁机制 / ACID/BASE）、计算公式 / 规则熟记（范式分解 / 无损连接判定 / 封锁协议应用）、流程类考点（E-R 转关系模型 / 关系代数运算 / 故障恢复步骤）按固定步骤解题、易混考点对比记忆（事务并发问题 / 备份类型 / NoSQL 分类）、新增知识点精准记忆（4NF / 分布式分片 / BASE 理论）、案例题注重 E-R 模型设计与范式分解的实操。

一、数据库系统概述

核心考点

数据库系统（DBS）组成、数据库管理系统（DBMS）功能与分类、数据库系统体系结构，选择题高频考查，易出概念匹配题。

知识点梳理

DBS 四大组成：数据库（数据集合）、硬件（运行硬件环境）、软件（DBMS / 操作系统 / 应用程序）、人员（DBA / 开发 / 用户）。
DBMS 五大核心功能：数据定义（定义数据结构）、数据库操作（增删改查）、数据库运行管理（并发 / 安全 / 完整性）、数据存储管理（物理存储）、数据库建立和维护（备份 / 恢复 / 优化）。
DBMS 三类分类：关系数据库系统（RDBS，主流）、面向对象数据库系统（OODBS）、对象关系数据库系统（ORDBS）。
数据库系统四大体系结构
- 集中式：所有资源集中在 DBMS 所在电脑，适用于小型系统；
- 客户端 / 服务器（C/S）：客户端负责请求 / 数据展示，服务器负责数据库服务，分工明确；
- 并行：多个物理相连的 CPU，提升处理速度；
- 分布式：数据物理分布在不同计算机，由全局 DBMS 统一管理，为第二版新增重点。

二、三级模式 - 两级映像

核心考点

三级模式定义、两级映像功能、逻辑 / 物理独立性，选择题必考，概念辨析高频。

知识点梳理

三级模式（从底到顶：物理级→概念级→用户级）
- 内模式（物理级）：管理数据物理存储，包括存储方式、优化、存放规则，对应实际数据库文件；
- 模式（概念模式 / 概念级）：即数据库表级别，根据应用将物理数据划分为多张表，是数据库的核心逻辑结构；
- 外模式（用户级）：对应数据库视图，对表加工后提供给用户，隐藏敏感数据，提升安全性。
两级映像及独立性（映像由 DBA 建立维护，修改映像无需改应用程序）
- 外模式 - 模式映像：表与视图的映射，保证逻辑独立性（表结构修改，应用程序无需调整）；
- 模式 - 内模式映像：表与物理存储的映射，保证物理独立性（数据存储方式修改，应用程序无需调整）。

三、数据库设计与建模

核心考点

数据库设计五阶段及产出物、E-R 模型三要素 / 属性分类 / 联系类型、E-R 模型转关系模型（案例题核心）、数据模型三要素与分类，选择 + 案例均为高频考查点。

知识点梳理

数据库设计五阶段（基于生命周期，必记阶段 + 任务 + 产出物）
- 规划阶段：分析建立数据库的必要性 / 可行性，确定其在信息系统中的地位及库间联系；
- 需求分析：调研用户数据 / 处理要求，产出需求说明书、数据流图、数据字典；
- 概念设计（概念结构设计）：抽象为独立于 DBMS 的概念模型（E-R 模型），解决局部 E-R 图三大冲突（属性 / 命名 / 结构）；
- 逻辑设计（逻辑结构设计）：将概念模型转化为特定 DBMS 的逻辑模型（如关系模型）；
- 物理设计（物理结构设计）：为逻辑模型选择最优物理结构（存储结构 / 存取方法），分 5 步：设计存储记录结构→确定数据存储安排→设计访问方法→完整性 / 安全性设计→数据库程序设计。
数据模型三要素：数据结构（数据组织形式）、数据操作（对数据的增删改查等）、数据约束条件（数据间的规则）。
数据模型四类分类
- 层次模型：最早出现，树状结构，一对多联系；
- 网状模型：有向图，支持多对多；
- 关系模型：表格结构，外键表示联系，主流模型；
- 面向对象模型：面向对象观点描述实体，支持复杂数据类型。
E-R 模型核心（三要素 + 表示方法）
- 三要素：实体（长方形）、属性（椭圆）、联系（菱形），联系两端标注联系类型（1:1、1:N、M:N）；
- 属性分类：简单 / 复合（是否可分割）、单值 / 多值（是否多个取值）、NULL（无意义）、派生属性（由其他属性生成）；
- 局部 E-R 图三大冲突：属性冲突（域 / 取值）、命名冲突（同名异义 / 异名同义）、结构冲突（同一对象不同抽象 / 同一实体属性不同）。
E-R 模型转关系模型（核心规则，案例题必用，确定表的数量与属性）
- 每个实体对应一个关系模式（一张表）；
- 1:1 联系：联系可作为属性加入任意一端实体表，需关联两端主键；
- 1:N 联系：联系可单独建表，或在N 端实体表中加入 1 端主键作为外键（推荐后者，减少表数量）；
- M:N 联系：联系必须单独建表，主键为 M、N 端实体的联合主键，同时包含联系的属性。

四、关系代数运算

核心考点

传统运算（并交差笛卡尔积）、专门运算（投影 / 选择 / 自然连接）、运算效率优化，计算题高频，选择题也常考运算结果判定。

知识点梳理

基本概念：关系模式等价于数据库表，运算对象为表，结果也为表。
传统关系运算（二目运算，要求两个表属性列数 / 类型一致）
- 并（∪）：合并两张表所有记录，相同记录仅显示一次；
- 交（∩）：仅显示两张表的相同记录；
- 差（-）：如 S1-S2，显示 S1 有而 S2 没有的记录；
- 笛卡尔积（×）：属性列为两表列数之和，记录数为两表记录数之积，所有记录两两组合（无关联条件，数据冗余大）。
专门关系运算（核心运算）
- 投影（π）：按条件选择表中的列，列可按名称 / 数字表示，会自动去重；
- 选择（σ）：按条件选择表中的行，条件为逻辑表达式；
- 自然连接（⋈）：显示两表全部属性列（相同属性列仅显示一次），仅保留属性名相同且值相等的记录（笛卡尔积的优化，消除冗余）。
运算效率优化核心规则 ：先筛选，后运算。在两表进行笛卡尔积 / 连接前，先通过选择 / 投影减少表的属性列数和记录数，减少参与运算的数据量，提升效率（如先对单表按条件筛选，再进行连接，远优于先连接再筛选）。

五、关系数据库的规范化

核心考点

函数依赖（部分 / 传递）、Armstrong 公理系统、键的分类与求法、完整性约束、范式（1NF-4NF）判定与分解、保持函数依赖 / 无损分解判定，核心难点，选择 + 案例均为高频，范式分解为案例题必考。

知识点梳理

函数依赖
- 基本定义：给定 X，能唯一确定 Y，则称 X→Y（Y 依赖于 X）；
- 两种扩展依赖（范式分解的核心依据）：
  - 部分函数依赖：(A,B)→C，且 A→C（复合主键的一部分可确定非主属性）；
  - 传递函数依赖：A→B，B→C，且 A 与 B 不等价，则 A→C（非主属性通过中间属性依赖于主键）。
Armstrong 公理系统（函数依赖推理规则，必记核心规则）
- 自反律：Y⊆X⊆U → X→Y（平凡函数依赖）；
- 增广律：X→Y → XZ→YZ（Z⊆U）；
- 传递律：X→Y、Y→Z → X→Z；
- 衍生规则：合并规则（X→Y、X→Z → X→YZ）、分解规则（X→W、Z⊆W → X→Z）、伪传递规则（X→Y、WY→Z → WX→Z）。
键的分类与求法（主属性 / 非主属性划分依据）
- 超键：能唯一标识表的属性组合（包含冗余属性）；
- 候选键：超键去掉冗余属性，是最小的超键，一个表可多个候选键；
- 主键：从候选键中任选一个，作为表的唯一标识；
- 外键：其他表中的主键，用于建立表间联系；
- 候选键求法：根据依赖集画有向图，从入度为 0的节点开始，找出能遍历整个图的节点 / 节点组合；
- 主属性：候选键内的属性；非主属性：候选键外的属性。
三大完整性约束（触发器为扩展约束）
- 实体完整性：主键约束，主键值非空且唯一；
- 参照完整性：外键约束，外键值必须是其他表的主键值，或为空；
- 用户自定义完整性：自定义规则（如年龄 0-150）；
- 触发器：通过脚本实现复杂约束，属于用户自定义完整性，兼具完整性 / 安全性保护功能，触发事件（增删改）会导致结果事件自动执行。
范式（1NF-4NF，第二版新增 4NF 为重点，范式逐级提升，需通过模式分解实现）
- 1NF：属性值为不可分的原子值，表中无 "小表"（如薪资不能拆分为基本工资 + 补贴）；问题：数据冗余、更新 / 插入 / 删除异常；
- 2NF ：满足 1NF，且非主属性完全函数依赖于候选键（消除部分函数依赖）；分解方法：将部分依赖的非主属性与依赖的主键部分拆分为新表；
- 3NF ：满足 2NF，且无非主属性对候选键的传递函数依赖（消除传递函数依赖）；分解方法：将传递依赖的非主属性与中间属性拆分为新表；
- BCNF ：满足 3NF，且消除主属性对候选键的部分 / 传递依赖 ；核心规则：每个依赖的左部决定因素必须包含候选键；
- 4NF（第二版新增） ：满足 BCNF，且消除非平凡的多值依赖；多值依赖定义：X→→Y，给定 (x,z)，Y 的取值仅由 x 决定，与 z 无关；4NF 允许的非平凡多值依赖为函数依赖。
模式分解（范式转换的手段，两大判定标准为核心）
- 保持函数依赖分解：分解后的关系模式保留原依赖集（冗余依赖如传递依赖可消除）；判定：①单个依赖的左右属性在同一分解表中，则保持；②若不满足①，用算法计算属性闭包，判断是否能推导出原依赖；
- 无损分解 ：分解后的关系模式能还原为原关系模式 ，无数据丢失；
  - 两表分解判定定理：R1∩R2→(R1-R2) 或 R1∩R2→(R2-R1)，满足则为无损；
  - 多表分解判定：表格法，根据依赖集逐步填充表格，若某一行全为√，则为无损；
  - 注意：拆分为单属性集必为有损分解。
反规范化技术（规范化的逆操作，为提升查询效率）
- 规范化问题：表拆分过多，多表关联查询效率低；
- 技术手段：增加派生性冗余列、增加冗余列、重新组表、分割表；核心：通过增加冗余减少表关联，提升查询速度。

六、事务管理

核心考点

事务 ACID 特性、事务并发三大问题、封锁协议（X 锁 / S 锁）、三级封锁协议应用、两段锁协议，选择题高频，封锁协议易出概念 / 案例题。

知识点梳理

事务基本操作：提交（commit，确认操作）、回滚（rollback，撤销操作）；事务是并发控制的前提，由一系列不可分割的操作组成。
事务四大特性（ACID，必背，概念辨析高频）
- 原子性：操作要么全做，要么全不做；
- 一致性：事务执行后数据状态一致（如银行转账，转出与转入金额相等）；
- 隔离性：事务执行过程对其他事务不可见，互不干涉；
- 持续性：事务提交后，操作结果永久保存，不可撤销。
事务并发三大问题（多事务同时执行导致，需通过封锁解决）
- 丢失更新：两个事务同时修改同一数据，后提交的覆盖先提交的结果；
- 不可重复读：一个事务两次读取同一数据，期间被其他事务修改，两次结果不同；
- 读脏数据：一个事务读取了另一个事务未提交的修改数据，后该事务回滚，读取的数据无效。
两种封锁类型（X 锁 / S 锁，核心区别）
- 排它锁（X 锁 / 写锁）：事务加 X 锁后，仅自身可读写数据，其他事务不能加任何锁，直到释放；
- 共享锁（S 锁 / 读锁）：事务加 S 锁后，仅自身可读数据（不可写），其他事务仅可加 S 锁（只读），直到释放。
三级封锁协议（对应解决不同并发问题，必记协议内容 + 解决问题）
- 一级封锁协议：修改数据前加 X 锁，事务结束释放；解决丢失更新；
- 二级封锁协议：一级 + 读数据前加 S 锁，读完立即释放；解决丢失更新、读脏数据；
- 三级封锁协议：一级 + 读数据前加 S 锁，事务结束释放 ；解决丢失更新、读脏数据、不可重复读（最严格）。
两段锁协议（并发调度可串行化的充分条件）
- 两个阶段：生长阶段（加锁阶段） （仅加锁，不加解锁）、衰退阶段（解锁阶段）（仅解锁，不加锁）；
- 实现：事务开始至 commit/rollback 为加锁阶段，commit/rollback 后为解锁阶段，DBMS 自动释放所有锁。

七、数据库安全

核心考点

数据库安全措施、数据故障类型与恢复方法、数据备份类型、日志文件作用，选择题高频，故障恢复 / 备份类型易出概念匹配题。

知识点梳理

五大安全措施（从外到内的保护体系）
- 用户标识和鉴定：最外层，如账户 / 口令 / 随机数检验；
- 存取控制：对用户授权（操作类型 + 数据对象）；
- 密码存储和传输：远程终端密码传输；
- 视图的保护：对视图进行授权，隐藏敏感数据；
- 审计：记录用户对数据库的所有操作，便于追溯。
四类数据故障与恢复方法（第二版新增数据恢复为重点）
- 事务可预期故障：自身逻辑问题，程序中预设 Rollback；
- 事务不可预期故障：算术溢出 / 存储保护，通过日志撤销修改，回滚到初始状态；
- 系统故障：系统停止运转，使用检查点法恢复；
- 介质故障：外存被破坏，日志重做业务+ 恢复最新备份。
故障恢复具体步骤（不同故障恢复流程，必记核心）
- 事务故障：反向扫描日志→对更新操作执行逆操作→读到事务开始标记为止（系统自动完成）；
- 系统故障：正向扫描日志→划分 Redo（已提交）/Undo（未完成）队列→Undo 队列逆操作，Redo 队列重新执行（系统重启自动完成）；
- 介质故障：装入最新备份→反向扫描日志找已提交事务→正向扫描日志重做操作；
- 检查点恢复：找到最后一个检查点→建立 A（正在执行）/R（重做）/U（撤销）队列→正向扫描日志更新队列→对 U 执行 Undo，对 R 执行 Redo。
数据备份类型（按不同维度划分，概念辨析高频）
- 按是否允许操作划分：
  - 静态转储（冷备份）：转储时禁止对数据库操作，优点：快速、易归档；缺点：仅恢复到某时间点、不能按表 / 用户恢复；
  - 动态转储（热备份）：转储时允许操作，并发执行；优点：秒级恢复、可按表空间备份；缺点：出错则结果无效；
- 按备份范围划分：
  - 完全备份：备份所有数据；
  - 差量备份：备份上一次完全备份后变化的数据；
  - 增量备份：备份上一次任意备份后变化的数据；
日志文件核心作用 ：实时记录事务的开始 / 结束及所有增删改操作，弥补备份的时间节点缺陷，保证数据库实时恢复，是故障恢复的核心依据。

八、数据库性能优化

核心考点

性能优化四大方面（硬件 / 设计 / 索引 / 查询），第二版新增为重点，选择题常考优化措施匹配。

知识点梳理

优化从四大维度入手，核心是提升查询 / 操作速度，减少资源消耗：

硬件升级：升级处理器、内存、磁盘子系统、网络，最直接的优化方式；
数据库设计优化
- 逻辑设计：存储常用计算属性、重新定义实体减少开支、水平 / 垂直分割关系提升并行度；
- 物理设计：属性数据类型取最小存储空间、频繁使用的关系分放至不同磁盘控制器、文本 / 图像属性单独存储；
索引优化策略（索引是查询提速利器，需合理建立）
- 建立原则：选经常查询、不常更新的属性建索引；
- 注意事项：索引过多影响增删改性能（需同步调整索引）；小表无需建索引；优先优化高频查询的索引；
查询优化（SQL 语句优化，必记核心策略）
- 建立物化视图、减少多表查询；
- 不相干子查询替代相干子查询；
- 仅检索需要的属性（避免 SELECT *）；
- IN 子句替代 OR 子句；
- 及时 COMMIT，尽早释放锁。

九、分布式数据库

核心考点

分布式数据库特点、体系结构、分片模式、分布透明性，第二版新增分片模式为重点，选择题高频。

知识点梳理

核心定义 ：局部数据库位于不同物理位置，由全局 DBMS联网统一管理的数据库系统。
四大核心特点
- 数据独立性：含逻辑 / 物理独立性 +分布独立性（分布透明性）；
- 集中与自治结合：局部 DBMS 可独立管理，全局有集中控制；
- 适当增加冗余度：多场地存储副本，提升可靠性 / 可用性 / 性能；
- 全局一致性、可串行性、可恢复性。
六层体系结构（从顶到底，第二版新增） ：全局外模式→全局概念模式→分片模式→分布模式→局部概念模式→局部内模式；核心新增分片模式 和分布模式。
四大分片模式（分片是将全局关系划分为逻辑片段，必记类型 + 重构方式）
- 水平分片：按属性值将元组分隔为子集，并操作重构全局关系；
- 垂直分片：按属性将关系分隔为子集（关键字不分割），连接操作重构；
- 导出分片（导出水平分片）：按其他关系的属性条件分片；
- 混合分片：水平 + 垂直分片结合。
四大分布透明性（用户无需关注数据分布细节，从高到低）
- 分片透明性：无需知道表的分片方式，最高级透明性；
- 位置透明性：无需知道数据的物理存储位置；
- 逻辑透明性：无需知道局部使用的数模模型；
- 复制透明性：无需知道数据的副本分布。
五大优点：解决部门分散数据关联问题、便于系统扩充、均衡负载、可由现有数据库自下而上构建、可靠性高（故障仅影响局部）。

十、数据仓库与数据挖掘

核心考点

数据仓库四大特点 / 结构 / 分类 / 设计方法、商业智能（BI）四阶段、数据挖掘流程 / 常用技术 / 分析方法，第二版新增为重点，选择题高频考查概念。

知识点梳理

数据仓库

核心定义 ：特殊的数据库，存储从业务数据库中抽取的历史数据，用于决策分析，与业务数据库的核心区别是用途（分析 vs 业务操作）。
四大核心特点（必背，概念辨析高频）：面向主题、集成的、相对稳定的、反映历史变化；
四层体系结构：数据源（基础）→数据存储与管理（核心）→OLAP 服务器（多维分析）→前端工具（报表 / 查询 / 挖掘）；
三类分类
- 企业仓库：面向企业级，集成全企业数据，TB 级，含详细 / 汇总数据；
- 数据集市：面向部门级，企业数据子集，分独立（数据源为业务系统）/ 从属（数据源为企业仓库）；
- 虚拟仓库：操作型数据库的视图集合，仅物化部分汇总视图；
三种设计方法
- 自顶向下：先建企业仓库，再从其抽取数据建从属数据集市；
- 自底向上：先建独立数据集市，再整合为企业仓库，投资少、回报快；
- 混合法：结合前两者，兼顾快速开发与长远价值。

商业智能（BI）

四核心阶段：数据预处理（ETL：抽取→转换→加载）→建立数据仓库→数据分析（OLAP + 数据挖掘）→数据展现（可视化）；
OLAP 核心功能：切片、切块、下钻、上卷、旋转，实现多维数据分析。

数据挖掘

核心定义：从海量数据中挖掘出隐藏的、有价值的信息 / 知识，甚至是违背直觉的规律。
七大流程（核心为模型化） ：问题定义→建立数据挖掘库→分析数据→调整数据→模型化（核心）→评价和解释→知识应用；
十二种常用技术：决策树、分类、粗糙集、神经网络、关联规则、概念树、遗传算法、依赖性分析、公式发现、统计分析、模糊论、可视化分析；
六种分析方法（必记核心应用场景）
- 关联分析：发现事件间的关联性（如啤酒与尿布）；
- 序列分析：发现时间间隔内的连续事件；
- 分类分析：为记录赋予标记，划分类别；
- 聚类分析："物以类聚"，将无标记记录划分为组（分类的逆操作）；
- 预测方法：估算连续型变量的取值；
- 时间序列分析：分析随时间变化的事件序列，预测趋势 / 发现周期。

十一、非关系数据库（NoSQL）

核心考点

NoSQL 四大分类（特点 / 产品 / 场景）、CAP 理论、BASE 理论、存储布局（行 / 列存储）、主流 NoSQL 特性，第二版新增为重点，选择题高频考查分类与理论。

知识点梳理

核心定义：非关系型数据库，无统一模型，适用于海量、非结构化 / 半结构化数据存储，弥补关系数据库在高并发、高扩展上的不足。

四大分类（按存储方式，必记产品 + 场景 + 优缺点，概念匹配高频）

分类	典型产品	应用场景	优点	缺点
文档存储	MongoDB、CouchDB	Web 应用、半结构化数据存储	结构灵活、可按 value 建索引	无统一查询语法、无事务处理
键值存储	Memcached、Redis	内容缓存（会话、配置）	扩展性好、性能高	数据无结构化、仅键查值
列存储	BigTable、HBase、Cassandra	分布式数据存储管理	扩展性强、查找快	功能局限、无事务强一致性
图存储	Neo4j、OrientDB	社交网络、推荐系统、系统图谱	支持复杂图形算法	复杂性高、数据规模有限

CAP 理论（分布式系统三大特性，三选二，必背）
- 一致性（C）：所有节点同一时刻有相同数据；
- 可用性（A）：所有操作均有成功 / 失败的响应；
- 分区容忍性（P）：网络分区时，系统仍能继续工作；
- 核心结论：分布式系统必须保证 P，因此只能在 CP 和 AP 之间选择。
BASE 理论（ACID 的变种，弱一致性，适用于 AP 架构，第二版新增重点）
- 核心：放弃强一致性，追求最终一致性，适用于高并发场景；
- 三要素：Basic Availability（基本可用）、Soft State（软状态）、Eventual Consistency（最终一致性）；
ACID 与 BASE 对比（概念辨析高频）
- ACID：强一致性、隔离性、关注操作提交、允许事务嵌套，偏 "保守"，难于演变；
- BASE：弱一致性、优先可用性、尽力服务、结果精度要求低，偏 "激进"，易于演变；
数据分区四大方法：内存缓存、集群、读写分离、范围分割 / 分片；
存储布局核心类型（行存储 vs 列存储，必记适用场景）
- 行存储：按记录聚合存储，适用于OLTP、增删改频繁的场景（如业务数据库）；
- 列存储：按字段聚合存储，适用于OLAP、数据仓库、数据挖掘（查询密集型），优点：减少读取数据量、易压缩；
主流 NoSQL 特性
- MongoDB（文档存储）：无表结构，以 BSON（JSON 二进制）存储，高性能、丰富查询、高可用、水平扩展；
- Redis（键值存储）：内存 + 磁盘存储（两者兼具型），支持 put/get/delete 操作，高性能、支持多种数据类型；
- 图存储：三要素为节点、关系、属性，适用于复杂关系分析。

十二、SQL 语言

核心考点

SQL 核心语法（增删改查 / 建表 / 索引 / 视图）、分组查询 / 排序 / 模糊查询、授权与收回、常用关键字，选择题高频，案例题也会涉及简单 SQL 编写。

知识点梳理

核心特点 ：关键字不区分大小写 ，条件判断中数字无引号、字符串加单引号。
数据定义语言（DDL） ：定义数据库对象，核心语法：
- 建表：CREATE TABLE 表名 (字段类型，PRIMARY KEY (主键), FOREIGN KEY (外键) REFERENCES 主表 (主键))；
- 修改表：ALTER TABLE 表名（添加 / 删除 / 修改字段）；
- 删除表：DROP TABLE 表名；
- 建索引：CREATE INDEX 索引名 ON 表名 (字段)；
- 建视图：CREATE VIEW 视图名 AS SELECT 语句；
数据操作语言（DML） ：操作数据，核心语法：
- 插入：INSERT INTO 表名 (字段) VALUES (值)；
- 删除：DELETE FROM 表名 WHERE 条件；
- 修改：UPDATE 表名 SET 字段 = 值 WHERE 条件；
数据查询语言（DQL） ：核心为 SELECT，最常考 ，语法：
- 基础查询：SELECT 字段（* 为所有） FROM 表名 WHERE 条件；
- 模糊查询：LIKE（% 匹配多个字符，_匹配单个字符）；
- 排序：ORDER BY 字段（DESC 为降序，默认升序）；
- 去重：DISTINCT（过滤重复记录）；
- 分组查询：GROUP BY 字段 HAVING 分组条件（HAVING 在 GROUP BY 后，过滤分组结果，WHERE 过滤行）；
- 集合运算：UNION（并）、INTERSECT（交）；
- 更名：AS（为表 / 字段重命名）；
数据控制语言（DCL） ：权限管理，核心语法：
- 授权：GRANT 操作权限 ON 数据库对象 TO 用户（WITH GRANT OPTION：允许用户转授权限）；
- 收回权限：REVOKE 操作权限 ON 数据库对象 FROM 用户；
常用关键字：WITH CHECK OPTION（检查视图查询的谓词条件）、IN（替代 OR，提升效率）。