目录
数据库管理系统
数据库系统一般由
- 数据库
- 数据库管理系统(database management system, DBMS)
- 应用系统
- 数据库管理员(database administrator, DBA)
- 用户
构成
大部分DBMS会提供数据定义语言(data definition language, DDL)和数据操作语言(data manipulation language, DML)
数据库系统划分为三级模式,三级模式之间有两级映射
数据模型
- 层次模型
- 网状模型
- 关系模型
- 面向对象模型
关系数据库
关系的基本概念
- 属性:事物的特征
- 域:数据的属性取值范围对应值的集合
- 目或者度:关系的属性个数
- 候选码:某一属性或者属性组的值能唯一表示一行数据
- 主码:候选码的某一个
- 主属性:候选码的属性
- 外码:是一个表中的某个属性(或属性组合),它指向另一个表的主码或候选码。
- 全码:关系模型的所有属性是这个关系模式的候选码
关系模型
关系运算
- 并
- 差
- 交
- 笛卡尔积
- 投影
- 选择
- 连接
规范化理论
范式(normal form, NF),分别为1NF,2NF,3NF,BCNF,4NF,5NF
数据库控制功能
事务:是用户定义的一个数据库操作序列,要么全做,要么全不做
其具有:原子性,一致性,隔离性(一个事务执行时不能被其他事务影响),持久性(事务一旦提交,改变就是永久的)
封锁协议
- 排他性封锁(x封锁):类似互斥锁
- 共享性封锁(s封锁):类似读写锁
数据库的完整性
数据库的安全
- 用户标识和鉴别
- 数据授权
- 视图
- 审计和跟踪
备份与恢复技术
- 物理备份:分为冷备份和热备份
- 逻辑备份
- 日志文件
- 数据恢复
数据库性能优化
- 硬件升级
- 数据库设计
- 索引优化策略
- 查询优化
数据库设计与建模
数据设计:
- 规划
- 需求分析
- 概念分析
- 逻辑设计
- 物理设计
实体联系模型(E-R模型)
- 实体:矩形框表示
- 属性:椭圆
- 实体之间的联系:菱形
分布式数据库系统
特定:
- 数据独立性
- 集中与自治共享结合的控制结构
- 适当增加数据冗余
- 全局的一致性,可串行性和可恢复性
体系结构:
- 全局外模式
- 全局概念模式
- 分片模式
- 分布模式
- 局部概念模式
- 局部内模式
数据分片
- 水平分片
- 垂直分片
- 导出分片
- 混合分片
数据仓库技术
OLAP(on-line analytical processing)联机分析处理
数据分析工具针对OLAP服务
报表工具,数据挖掘针对数据仓库
数据处理分为:联机事务处理(on-line transaction processing, OLTP)和OLAP
OLTP是传统数据库的主要应用,支持基本的,日常事务处理
OLAP是数据仓库的主要应用,支持法的分析操作,侧重决策支持
数据仓库概述
抽取,转换,加载(extraction transformation loading,ETL)
数据仓库的分类:企业仓库,数据集市,虚拟仓库
数据挖掘技术
数据挖掘的体系结构
- 知识发现管理系统
- 知识库
- 数据访问接口
- 数据选择
- 知识发现引擎
- 发现评价
- 发现描述
数据挖掘流程
- 问题定义
- 建立数据挖掘库
- 分析数据
- 调整数据
- 模型化
- 评价和解释
常用技术
- 决策树方法
- 分类方法
- 粗糙集方法
- 神经网络
- 关联规则
- 概念树方法
- 遗传算法
- 依赖性分析
- 公式发现
- 统计分析方法
- 模糊论方法
- 可视化方法
分析方法
- 关联分析
- 序列分析
- 分类分析
- 具类分析
- 预测方法
- 时间序列分析
非关系数据库
分类:
- 文档存储
- 键值存储
- 列存储
- 图存储