【系统分析师_知识点整理】 3.数据库系统

**核心考向:**数据库系统组成与体系结构、三级模式两级映像(逻辑 / 物理独立性为选择题高频)、数据库设计五阶段(E-R 模型设计与转换为案例题重点)、关系代数运算(并交差笛卡尔积 / 自然连接为计算题高频)、规范化理论(范式判定 / 模式分解为核心难点,选择 + 案例均常考)、事务管理(ACID 特性 / 并发问题 / 封锁协议)、数据库安全与恢复(故障处理 / 备份类型)、分布式数据库(分片模式 / 分布透明性)、数据仓库与数据挖掘、非关系数据库(NoSQL 分类 / CAP/BASE)、SQL 语法(增删改查 / 授权收回);第二版新增 θ 连接 / 等值连接 / 除法运算 / 元组演算、4NF、数据恢复、性能优化、分布式数据库分片、数据仓库分类设计、数据挖掘、非关系数据库为考查重点,删除大数据知识点,扩展补充内容几乎不考无需深究。

**解题关键:**概念辨析清晰(三级模式 / 各种范式 / 锁机制 / ACID/BASE)、计算公式 / 规则熟记(范式分解 / 无损连接判定 / 封锁协议应用)、流程类考点(E-R 转关系模型 / 关系代数运算 / 故障恢复步骤)按固定步骤解题、易混考点对比记忆(事务并发问题 / 备份类型 / NoSQL 分类)、新增知识点精准记忆(4NF / 分布式分片 / BASE 理论)、案例题注重 E-R 模型设计与范式分解的实操。

一、数据库系统概述

核心考点

数据库系统(DBS)组成、数据库管理系统(DBMS)功能与分类、数据库系统体系结构,选择题高频考查,易出概念匹配题。

知识点梳理

  1. DBS 四大组成:数据库(数据集合)、硬件(运行硬件环境)、软件(DBMS / 操作系统 / 应用程序)、人员(DBA / 开发 / 用户)。
  2. DBMS 五大核心功能:数据定义(定义数据结构)、数据库操作(增删改查)、数据库运行管理(并发 / 安全 / 完整性)、数据存储管理(物理存储)、数据库建立和维护(备份 / 恢复 / 优化)。
  3. DBMS 三类分类:关系数据库系统(RDBS,主流)、面向对象数据库系统(OODBS)、对象关系数据库系统(ORDBS)。
  4. 数据库系统四大体系结构
    • 集中式:所有资源集中在 DBMS 所在电脑,适用于小型系统;
    • 客户端 / 服务器(C/S):客户端负责请求 / 数据展示,服务器负责数据库服务,分工明确;
    • 并行:多个物理相连的 CPU,提升处理速度;
    • 分布式:数据物理分布在不同计算机,由全局 DBMS 统一管理,为第二版新增重点。

二、三级模式 - 两级映像

核心考点

三级模式定义、两级映像功能、逻辑 / 物理独立性,选择题必考,概念辨析高频。

知识点梳理

  1. 三级模式(从底到顶:物理级→概念级→用户级)
    • 内模式(物理级):管理数据物理存储,包括存储方式、优化、存放规则,对应实际数据库文件;
    • 模式(概念模式 / 概念级):即数据库表级别,根据应用将物理数据划分为多张表,是数据库的核心逻辑结构;
    • 外模式(用户级):对应数据库视图,对表加工后提供给用户,隐藏敏感数据,提升安全性。
  2. 两级映像及独立性(映像由 DBA 建立维护,修改映像无需改应用程序)
    • 外模式 - 模式映像:表与视图的映射,保证逻辑独立性(表结构修改,应用程序无需调整);
    • 模式 - 内模式映像:表与物理存储的映射,保证物理独立性(数据存储方式修改,应用程序无需调整)。

三、数据库设计与建模

核心考点

数据库设计五阶段及产出物、E-R 模型三要素 / 属性分类 / 联系类型、E-R 模型转关系模型(案例题核心)、数据模型三要素与分类,选择 + 案例均为高频考查点。

知识点梳理

  1. 数据库设计五阶段(基于生命周期,必记阶段 + 任务 + 产出物)
    • 规划阶段:分析建立数据库的必要性 / 可行性,确定其在信息系统中的地位及库间联系;
    • 需求分析:调研用户数据 / 处理要求,产出需求说明书、数据流图、数据字典
    • 概念设计(概念结构设计):抽象为独立于 DBMS 的概念模型(E-R 模型),解决局部 E-R 图三大冲突(属性 / 命名 / 结构);
    • 逻辑设计(逻辑结构设计):将概念模型转化为特定 DBMS 的逻辑模型(如关系模型);
    • 物理设计(物理结构设计):为逻辑模型选择最优物理结构(存储结构 / 存取方法),分 5 步:设计存储记录结构→确定数据存储安排→设计访问方法→完整性 / 安全性设计→数据库程序设计。
  2. 数据模型三要素:数据结构(数据组织形式)、数据操作(对数据的增删改查等)、数据约束条件(数据间的规则)。
  3. 数据模型四类分类
    • 层次模型:最早出现,树状结构,一对多联系;
    • 网状模型:有向图,支持多对多;
    • 关系模型:表格结构,外键表示联系,主流模型;
    • 面向对象模型:面向对象观点描述实体,支持复杂数据类型。
  4. E-R 模型核心(三要素 + 表示方法)
    • 三要素:实体(长方形)、属性(椭圆)、联系(菱形),联系两端标注联系类型(1:1、1:N、M:N);
    • 属性分类:简单 / 复合(是否可分割)、单值 / 多值(是否多个取值)、NULL(无意义)、派生属性(由其他属性生成);
    • 局部 E-R 图三大冲突:属性冲突(域 / 取值)、命名冲突(同名异义 / 异名同义)、结构冲突(同一对象不同抽象 / 同一实体属性不同)。
  5. E-R 模型转关系模型(核心规则,案例题必用,确定表的数量与属性)
    • 每个实体对应一个关系模式(一张表);
    • 1:1 联系:联系可作为属性加入任意一端实体表,需关联两端主键;
    • 1:N 联系:联系可单独建表,或在N 端实体表中加入 1 端主键作为外键(推荐后者,减少表数量);
    • M:N 联系:联系必须单独建表,主键为 M、N 端实体的联合主键,同时包含联系的属性。

四、关系代数运算

核心考点

传统运算(并交差笛卡尔积)、专门运算(投影 / 选择 / 自然连接)、运算效率优化,计算题高频,选择题也常考运算结果判定。

知识点梳理

  1. 基本概念:关系模式等价于数据库表,运算对象为表,结果也为表。
  2. 传统关系运算(二目运算,要求两个表属性列数 / 类型一致)
    • 并(∪):合并两张表所有记录,相同记录仅显示一次;
    • 交(∩):仅显示两张表的相同记录;
    • 差(-):如 S1-S2,显示 S1 有而 S2 没有的记录;
    • 笛卡尔积(×):属性列为两表列数之和,记录数为两表记录数之积,所有记录两两组合(无关联条件,数据冗余大)。
  3. 专门关系运算(核心运算)
    • 投影(π):按条件选择表中的,列可按名称 / 数字表示,会自动去重;
    • 选择(σ):按条件选择表中的,条件为逻辑表达式;
    • 自然连接(⋈):显示两表全部属性列(相同属性列仅显示一次),仅保留属性名相同且值相等的记录(笛卡尔积的优化,消除冗余)。
  4. 运算效率优化核心规则先筛选,后运算。在两表进行笛卡尔积 / 连接前,先通过选择 / 投影减少表的属性列数和记录数,减少参与运算的数据量,提升效率(如先对单表按条件筛选,再进行连接,远优于先连接再筛选)。

五、关系数据库的规范化

核心考点

函数依赖(部分 / 传递)、Armstrong 公理系统、键的分类与求法、完整性约束、范式(1NF-4NF)判定与分解、保持函数依赖 / 无损分解判定,核心难点,选择 + 案例均为高频,范式分解为案例题必考。

知识点梳理

  1. 函数依赖
    • 基本定义:给定 X,能唯一确定 Y,则称 X→Y(Y 依赖于 X);
    • 两种扩展依赖(范式分解的核心依据):
      • 部分函数依赖:(A,B)→C,且 A→C(复合主键的一部分可确定非主属性);
      • 传递函数依赖:A→B,B→C,且 A 与 B 不等价,则 A→C(非主属性通过中间属性依赖于主键)。
  2. Armstrong 公理系统(函数依赖推理规则,必记核心规则)
    • 自反律:Y⊆X⊆U → X→Y(平凡函数依赖);
    • 增广律:X→Y → XZ→YZ(Z⊆U);
    • 传递律:X→Y、Y→Z → X→Z;
    • 衍生规则:合并规则(X→Y、X→Z → X→YZ)、分解规则(X→W、Z⊆W → X→Z)、伪传递规则(X→Y、WY→Z → WX→Z)。
  3. 键的分类与求法(主属性 / 非主属性划分依据)
    • 超键:能唯一标识表的属性组合(包含冗余属性);
    • 候选键:超键去掉冗余属性,是最小的超键,一个表可多个候选键;
    • 主键:从候选键中任选一个,作为表的唯一标识;
    • 外键:其他表中的主键,用于建立表间联系;
    • 候选键求法:根据依赖集画有向图,从入度为 0的节点开始,找出能遍历整个图的节点 / 节点组合;
    • 主属性:候选键内的属性;非主属性:候选键外的属性。
  4. 三大完整性约束(触发器为扩展约束)
    • 实体完整性:主键约束,主键值非空且唯一
    • 参照完整性:外键约束,外键值必须是其他表的主键值,或为空
    • 用户自定义完整性:自定义规则(如年龄 0-150);
    • 触发器:通过脚本实现复杂约束,属于用户自定义完整性,兼具完整性 / 安全性保护功能,触发事件(增删改)会导致结果事件自动执行。
  5. 范式(1NF-4NF,第二版新增 4NF 为重点,范式逐级提升,需通过模式分解实现)
    • 1NF:属性值为不可分的原子值,表中无 "小表"(如薪资不能拆分为基本工资 + 补贴);问题:数据冗余、更新 / 插入 / 删除异常;
    • 2NF :满足 1NF,且非主属性完全函数依赖于候选键(消除部分函数依赖);分解方法:将部分依赖的非主属性与依赖的主键部分拆分为新表;
    • 3NF :满足 2NF,且无非主属性对候选键的传递函数依赖(消除传递函数依赖);分解方法:将传递依赖的非主属性与中间属性拆分为新表;
    • BCNF :满足 3NF,且消除主属性对候选键的部分 / 传递依赖 ;核心规则:每个依赖的左部决定因素必须包含候选键
    • 4NF(第二版新增) :满足 BCNF,且消除非平凡的多值依赖;多值依赖定义:X→→Y,给定 (x,z),Y 的取值仅由 x 决定,与 z 无关;4NF 允许的非平凡多值依赖为函数依赖。
  6. 模式分解(范式转换的手段,两大判定标准为核心)
    • 保持函数依赖分解:分解后的关系模式保留原依赖集(冗余依赖如传递依赖可消除);判定:①单个依赖的左右属性在同一分解表中,则保持;②若不满足①,用算法计算属性闭包,判断是否能推导出原依赖;
    • 无损分解 :分解后的关系模式能还原为原关系模式 ,无数据丢失;
      • 两表分解判定定理:R1∩R2→(R1-R2) 或 R1∩R2→(R2-R1),满足则为无损;
      • 多表分解判定:表格法,根据依赖集逐步填充表格,若某一行全为√,则为无损;
      • 注意:拆分为单属性集必为有损分解。
  7. 反规范化技术(规范化的逆操作,为提升查询效率)
    • 规范化问题:表拆分过多,多表关联查询效率低;
    • 技术手段:增加派生性冗余列、增加冗余列、重新组表、分割表;核心:通过增加冗余减少表关联,提升查询速度。

六、事务管理

核心考点

事务 ACID 特性、事务并发三大问题、封锁协议(X 锁 / S 锁)、三级封锁协议应用、两段锁协议,选择题高频,封锁协议易出概念 / 案例题。

知识点梳理

  1. 事务基本操作:提交(commit,确认操作)、回滚(rollback,撤销操作);事务是并发控制的前提,由一系列不可分割的操作组成。
  2. 事务四大特性(ACID,必背,概念辨析高频)
    • 原子性:操作要么全做,要么全不做;
    • 一致性:事务执行后数据状态一致(如银行转账,转出与转入金额相等);
    • 隔离性:事务执行过程对其他事务不可见,互不干涉;
    • 持续性:事务提交后,操作结果永久保存,不可撤销。
  3. 事务并发三大问题(多事务同时执行导致,需通过封锁解决)
    • 丢失更新:两个事务同时修改同一数据,后提交的覆盖先提交的结果;
    • 不可重复读:一个事务两次读取同一数据,期间被其他事务修改,两次结果不同;
    • 读脏数据:一个事务读取了另一个事务未提交的修改数据,后该事务回滚,读取的数据无效。
  4. 两种封锁类型(X 锁 / S 锁,核心区别)
    • 排它锁(X 锁 / 写锁):事务加 X 锁后,仅自身可读写数据,其他事务不能加任何锁,直到释放;
    • 共享锁(S 锁 / 读锁):事务加 S 锁后,仅自身可读数据(不可写),其他事务仅可加 S 锁(只读),直到释放。
  5. 三级封锁协议(对应解决不同并发问题,必记协议内容 + 解决问题)
    • 一级封锁协议:修改数据前加 X 锁,事务结束释放;解决丢失更新
    • 二级封锁协议:一级 + 读数据前加 S 锁,读完立即释放;解决丢失更新、读脏数据
    • 三级封锁协议:一级 + 读数据前加 S 锁,事务结束释放解决丢失更新、读脏数据、不可重复读(最严格)。
  6. 两段锁协议(并发调度可串行化的充分条件)
    • 两个阶段:生长阶段(加锁阶段) (仅加锁,不加解锁)、衰退阶段(解锁阶段)(仅解锁,不加锁);
    • 实现:事务开始至 commit/rollback 为加锁阶段,commit/rollback 后为解锁阶段,DBMS 自动释放所有锁。

七、数据库安全

核心考点

数据库安全措施、数据故障类型与恢复方法、数据备份类型、日志文件作用,选择题高频,故障恢复 / 备份类型易出概念匹配题。

知识点梳理

  1. 五大安全措施(从外到内的保护体系)
    • 用户标识和鉴定:最外层,如账户 / 口令 / 随机数检验;
    • 存取控制:对用户授权(操作类型 + 数据对象);
    • 密码存储和传输:远程终端密码传输;
    • 视图的保护:对视图进行授权,隐藏敏感数据;
    • 审计:记录用户对数据库的所有操作,便于追溯。
  2. 四类数据故障与恢复方法(第二版新增数据恢复为重点)
    • 事务可预期故障:自身逻辑问题,程序中预设 Rollback
    • 事务不可预期故障:算术溢出 / 存储保护,通过日志撤销修改,回滚到初始状态;
    • 系统故障:系统停止运转,使用检查点法恢复;
    • 介质故障:外存被破坏,日志重做业务+ 恢复最新备份。
  3. 故障恢复具体步骤(不同故障恢复流程,必记核心)
    • 事务故障:反向扫描日志→对更新操作执行逆操作→读到事务开始标记为止(系统自动完成);
    • 系统故障:正向扫描日志→划分 Redo(已提交)/Undo(未完成)队列→Undo 队列逆操作,Redo 队列重新执行(系统重启自动完成);
    • 介质故障:装入最新备份→反向扫描日志找已提交事务→正向扫描日志重做操作;
    • 检查点恢复:找到最后一个检查点→建立 A(正在执行)/R(重做)/U(撤销)队列→正向扫描日志更新队列→对 U 执行 Undo,对 R 执行 Redo。
  4. 数据备份类型(按不同维度划分,概念辨析高频)
    • 按是否允许操作划分:
      • 静态转储(冷备份):转储时禁止对数据库操作,优点:快速、易归档;缺点:仅恢复到某时间点、不能按表 / 用户恢复;
      • 动态转储(热备份):转储时允许操作,并发执行;优点:秒级恢复、可按表空间备份;缺点:出错则结果无效;
    • 按备份范围划分:
      • 完全备份:备份所有数据;
      • 差量备份:备份上一次完全备份后变化的数据;
      • 增量备份:备份上一次任意备份后变化的数据;
  5. 日志文件核心作用 :实时记录事务的开始 / 结束及所有增删改操作,弥补备份的时间节点缺陷,保证数据库实时恢复,是故障恢复的核心依据。

八、数据库性能优化

核心考点

性能优化四大方面(硬件 / 设计 / 索引 / 查询),第二版新增为重点,选择题常考优化措施匹配。

知识点梳理

优化从四大维度入手,核心是提升查询 / 操作速度,减少资源消耗:

  1. 硬件升级:升级处理器、内存、磁盘子系统、网络,最直接的优化方式;
  2. 数据库设计优化
    • 逻辑设计:存储常用计算属性、重新定义实体减少开支、水平 / 垂直分割关系提升并行度;
    • 物理设计:属性数据类型取最小存储空间、频繁使用的关系分放至不同磁盘控制器、文本 / 图像属性单独存储;
  3. 索引优化策略(索引是查询提速利器,需合理建立)
    • 建立原则:选经常查询、不常更新的属性建索引;
    • 注意事项:索引过多影响增删改性能(需同步调整索引);小表无需建索引;优先优化高频查询的索引;
  4. 查询优化(SQL 语句优化,必记核心策略)
    • 建立物化视图、减少多表查询;
    • 不相干子查询替代相干子查询;
    • 仅检索需要的属性(避免 SELECT *);
    • IN 子句替代 OR 子句;
    • 及时 COMMIT,尽早释放锁。

九、分布式数据库

核心考点

分布式数据库特点、体系结构、分片模式、分布透明性,第二版新增分片模式为重点,选择题高频。

知识点梳理

  1. 核心定义 :局部数据库位于不同物理位置,由全局 DBMS联网统一管理的数据库系统。
  2. 四大核心特点
    • 数据独立性:含逻辑 / 物理独立性 +分布独立性(分布透明性)
    • 集中与自治结合:局部 DBMS 可独立管理,全局有集中控制;
    • 适当增加冗余度:多场地存储副本,提升可靠性 / 可用性 / 性能;
    • 全局一致性、可串行性、可恢复性。
  3. 六层体系结构(从顶到底,第二版新增) :全局外模式→全局概念模式→分片模式→分布模式→局部概念模式→局部内模式;核心新增分片模式分布模式
  4. 四大分片模式(分片是将全局关系划分为逻辑片段,必记类型 + 重构方式)
    • 水平分片:按属性值将元组分隔为子集,并操作重构全局关系;
    • 垂直分片:按属性将关系分隔为子集(关键字不分割),连接操作重构;
    • 导出分片(导出水平分片):按其他关系的属性条件分片;
    • 混合分片:水平 + 垂直分片结合。
  5. 四大分布透明性(用户无需关注数据分布细节,从高到低)
    • 分片透明性:无需知道表的分片方式,最高级透明性;
    • 位置透明性:无需知道数据的物理存储位置;
    • 逻辑透明性:无需知道局部使用的数模模型;
    • 复制透明性:无需知道数据的副本分布。
  6. 五大优点:解决部门分散数据关联问题、便于系统扩充、均衡负载、可由现有数据库自下而上构建、可靠性高(故障仅影响局部)。

十、数据仓库与数据挖掘

核心考点

数据仓库四大特点 / 结构 / 分类 / 设计方法、商业智能(BI)四阶段、数据挖掘流程 / 常用技术 / 分析方法,第二版新增为重点,选择题高频考查概念。

知识点梳理

数据仓库
  1. 核心定义 :特殊的数据库,存储从业务数据库中抽取的历史数据,用于决策分析,与业务数据库的核心区别是用途(分析 vs 业务操作)。
  2. 四大核心特点(必背,概念辨析高频):面向主题、集成的、相对稳定的、反映历史变化;
  3. 四层体系结构:数据源(基础)→数据存储与管理(核心)→OLAP 服务器(多维分析)→前端工具(报表 / 查询 / 挖掘);
  4. 三类分类
    • 企业仓库:面向企业级,集成全企业数据,TB 级,含详细 / 汇总数据;
    • 数据集市:面向部门级,企业数据子集,分独立(数据源为业务系统)/ 从属(数据源为企业仓库);
    • 虚拟仓库:操作型数据库的视图集合,仅物化部分汇总视图;
  5. 三种设计方法
    • 自顶向下:先建企业仓库,再从其抽取数据建从属数据集市;
    • 自底向上:先建独立数据集市,再整合为企业仓库,投资少、回报快;
    • 混合法:结合前两者,兼顾快速开发与长远价值。
商业智能(BI)
  1. 四核心阶段:数据预处理(ETL:抽取→转换→加载)→建立数据仓库→数据分析(OLAP + 数据挖掘)→数据展现(可视化);
  2. OLAP 核心功能:切片、切块、下钻、上卷、旋转,实现多维数据分析。
数据挖掘
  1. 核心定义:从海量数据中挖掘出隐藏的、有价值的信息 / 知识,甚至是违背直觉的规律。
  2. 七大流程(核心为模型化) :问题定义→建立数据挖掘库→分析数据→调整数据→模型化(核心)→评价和解释→知识应用;
  3. 十二种常用技术:决策树、分类、粗糙集、神经网络、关联规则、概念树、遗传算法、依赖性分析、公式发现、统计分析、模糊论、可视化分析;
  4. 六种分析方法(必记核心应用场景)
    • 关联分析:发现事件间的关联性(如啤酒与尿布);
    • 序列分析:发现时间间隔内的连续事件;
    • 分类分析:为记录赋予标记,划分类别;
    • 聚类分析:"物以类聚",将无标记记录划分为组(分类的逆操作);
    • 预测方法:估算连续型变量的取值;
    • 时间序列分析:分析随时间变化的事件序列,预测趋势 / 发现周期。

十一、非关系数据库(NoSQL)

核心考点

NoSQL 四大分类(特点 / 产品 / 场景)、CAP 理论、BASE 理论、存储布局(行 / 列存储)、主流 NoSQL 特性,第二版新增为重点,选择题高频考查分类与理论。

知识点梳理

  1. 核心定义:非关系型数据库,无统一模型,适用于海量、非结构化 / 半结构化数据存储,弥补关系数据库在高并发、高扩展上的不足。

  2. 四大分类(按存储方式,必记产品 + 场景 + 优缺点,概念匹配高频)

    分类 典型产品 应用场景 优点 缺点
    文档存储 MongoDB、CouchDB Web 应用、半结构化数据存储 结构灵活、可按 value 建索引 无统一查询语法、无事务处理
    键值存储 Memcached、Redis 内容缓存(会话、配置) 扩展性好、性能高 数据无结构化、仅键查值
    列存储 BigTable、HBase、Cassandra 分布式数据存储管理 扩展性强、查找快 功能局限、无事务强一致性
    图存储 Neo4j、OrientDB 社交网络、推荐系统、系统图谱 支持复杂图形算法 复杂性高、数据规模有限
  3. CAP 理论(分布式系统三大特性,三选二,必背)

    • 一致性(C):所有节点同一时刻有相同数据;
    • 可用性(A):所有操作均有成功 / 失败的响应;
    • 分区容忍性(P):网络分区时,系统仍能继续工作;
    • 核心结论:分布式系统必须保证 P,因此只能在 CP 和 AP 之间选择。
  4. BASE 理论(ACID 的变种,弱一致性,适用于 AP 架构,第二版新增重点)

    • 核心:放弃强一致性,追求最终一致性,适用于高并发场景;
    • 三要素:Basic Availability(基本可用)、Soft State(软状态)、Eventual Consistency(最终一致性);
  5. ACID 与 BASE 对比(概念辨析高频)

    • ACID:强一致性、隔离性、关注操作提交、允许事务嵌套,偏 "保守",难于演变;
    • BASE:弱一致性、优先可用性、尽力服务、结果精度要求低,偏 "激进",易于演变;
  6. 数据分区四大方法:内存缓存、集群、读写分离、范围分割 / 分片;

  7. 存储布局核心类型(行存储 vs 列存储,必记适用场景)

    • 行存储:按记录聚合存储,适用于OLTP、增删改频繁的场景(如业务数据库);
    • 列存储:按字段聚合存储,适用于OLAP、数据仓库、数据挖掘(查询密集型),优点:减少读取数据量、易压缩;
  8. 主流 NoSQL 特性

    • MongoDB(文档存储):无表结构,以 BSON(JSON 二进制)存储,高性能、丰富查询、高可用、水平扩展;
    • Redis(键值存储):内存 + 磁盘存储(两者兼具型),支持 put/get/delete 操作,高性能、支持多种数据类型;
    • 图存储:三要素为节点、关系、属性,适用于复杂关系分析。

十二、SQL 语言

核心考点

SQL 核心语法(增删改查 / 建表 / 索引 / 视图)、分组查询 / 排序 / 模糊查询、授权与收回、常用关键字,选择题高频,案例题也会涉及简单 SQL 编写。

知识点梳理

  1. 核心特点 :关键字不区分大小写 ,条件判断中数字无引号、字符串加单引号
  2. 数据定义语言(DDL) :定义数据库对象,核心语法:
    • 建表:CREATE TABLE 表名 (字段 类型,PRIMARY KEY (主键), FOREIGN KEY (外键) REFERENCES 主表 (主键));
    • 修改表:ALTER TABLE 表名(添加 / 删除 / 修改字段);
    • 删除表:DROP TABLE 表名;
    • 建索引:CREATE INDEX 索引名 ON 表名 (字段);
    • 建视图:CREATE VIEW 视图名 AS SELECT 语句;
  3. 数据操作语言(DML) :操作数据,核心语法:
    • 插入:INSERT INTO 表名 (字段) VALUES (值);
    • 删除:DELETE FROM 表名 WHERE 条件;
    • 修改:UPDATE 表名 SET 字段 = 值 WHERE 条件;
  4. 数据查询语言(DQL) :核心为 SELECT,最常考 ,语法:
    • 基础查询:SELECT 字段(* 为所有) FROM 表名 WHERE 条件;
    • 模糊查询:LIKE(% 匹配多个字符,_匹配单个字符);
    • 排序:ORDER BY 字段(DESC 为降序,默认升序);
    • 去重:DISTINCT(过滤重复记录);
    • 分组查询:GROUP BY 字段 HAVING 分组条件(HAVING 在 GROUP BY 后,过滤分组结果,WHERE 过滤行);
    • 集合运算:UNION(并)、INTERSECT(交);
    • 更名:AS(为表 / 字段重命名);
  5. 数据控制语言(DCL) :权限管理,核心语法:
    • 授权:GRANT 操作权限 ON 数据库对象 TO 用户(WITH GRANT OPTION:允许用户转授权限);
    • 收回权限:REVOKE 操作权限 ON 数据库对象 FROM 用户;
  6. 常用关键字:WITH CHECK OPTION(检查视图查询的谓词条件)、IN(替代 OR,提升效率)。
相关推荐
李子琪。2 小时前
攀山的人
经验分享·笔记·百度·新浪微博
6+h2 小时前
【Redis】高可用核心讲解
数据库·redis·缓存
2501_926978332 小时前
物理学原理和人工智能领域的底层一致性
人工智能·经验分享·笔记·ai写作
努力的lpp2 小时前
2024小迪安全课程第三节复习笔记
笔记·安全
@insist1232 小时前
软件设计师-组网技术基础:网络设备、传输介质与局域网核心协议
开发语言·网络·软考·软件设计师·软件水平考试
冥王丁B2 小时前
第31章 Prompt 与聊天模型笔记
笔记·python·prompt
海棠蚀omo2 小时前
从零敲开 MySQL 的大门:库与表的基础操作实战(保姆级入门指南)
数据库·mysql
鸽芷咕2 小时前
告别迁移焦虑:KingbaseES如何搞定Oracle复杂的层次查询与伪列?
数据库·oracle