数据库系统概论（个人笔记）（第二部分）

数据库系统概论（个人笔记）

文章目录

数据库系统概论（个人笔记）
2、关系模型简介
- [2.1 关系数据库的结构](#2.1 关系数据库的结构)
- [2.2 数据库模式](#2.2 数据库模式)
- [2.3 键](#2.3 键)
- [2.4 模式图](#2.4 模式图)
- [2.5 关系查询语言](#2.5 关系查询语言)
- [2.6 关系代数](#2.6 关系代数)

2、关系模型简介

2.1 关系数据库的结构

Structure of Relational Databases

在逻辑级别上，关系数据库是一个名为 Relations 的二维表的集合。

Relations 表示一个实体集或一个关系集。（集合）

Relations 的一行表示一个实体或一个关系。（个体）

Basic Structure

关系的每一行都可以称为元组 tuple。

关系的每一列都有一个名称 → 关系的命名列称为属性 attributes。

每个属性允许的值的集合称为属性的域 domain。

属性值（通常）必须是原子的 atomic ；也就是说，它是不可分割的：

属性上的元组的值可以是一个帐号，但不能是一组帐号

特殊值 null 是每个域的成员。

Relation

笛卡尔积 Cartesian Product

Tuple Variable

元组变量 Tuple Variable

是一个变量，代表一个元组
其域是一个特定关系的所有元组的集合

2.2 数据库模式

Database Schema
Relation Schema

关系模式 relation schema

Relations are Unordered

元组的顺序是无关的（元组可以以任意顺序存储）。

Relational Database

一个数据库由多个关系组成。

有关企业的信息被分成若干部分，每个关系存储一部分信息。

将所有信息存储为一个简单的 relation。

university(instr_id, inst_name, stu_id, stu_name,...)

重复的信息------（会导致）如果两个导师给一个学生建议（What gets repeated?）
空值的需要------来代表一个没有老师的学生

规范化理论（第7章）涉及如何设计关系模式

2.3 键

Keys

K 是一组属性，设K ⊆ R

如果 K 的值足以识别每个可能关系 r® 的唯一元组，则K是R的超键 superkey

"可能的 r" 是指可能存在于我们正在建模的企业中的关系。

如果K最小，则超键 K 为候选密钥 candidate key

极小意味着它的任何子集都不是超级密钥

主键 Primary key：作为识别关系中元组的主要手段而选择的候选键

应该选择一个其值永远或很少改变的属性

电子邮件地址是唯一的，但可能会改变，不适合主键

Foreign Keys

关系 r1 可能具有与另一个关系 r2 的主键相对应的属性。该属性称为外键 foregin key

r1 是引用关系 r1 is referencing relation
r2 是被引用的关系 r2 is referenced relation

Referencing Constraint

Referencing Constraint 引用约束

只有出现在被引用关系 referenced relation 的主键属性中的值才可能出现在引用关系 referencing relation 的外键属性中

2.4 模式图

Schema Diagrams

Schema Diagram for University Database

2.5 关系查询语言

Relational Query Languages

用户从数据库请求信息的语言。

语言类别

程序性
非程序性，或声明性

"纯 Pure" 的语言：形成人们使用的查询语言的基础

关系代数程序性
元组关系演算非程序性
域关系演算非程序性

以上3种纯语言在计算能力上是等价的在本章中

我们将集中讨论关系代数

不是图灵机等价物
由6个基本操作组成

2.6 关系代数

The Relational Algebra

一种由一组操作组成的过程语言，这些操作把一个或两个关系作为输入，并产生一个新的关系作为其结果。

六种基本运算符
select 选择	σ
project 投影	∏
union 并	∪
set difference 集合差	-
Cartesian product 笛卡尔积	×
rename 重命名	ρ

Select Operation

选择满足给定谓词的元组

Project Operation

一元操作，选取某些列

结果被定义为通过擦除未列出的列而获得的k列之间的关系

从结果中删除重复行，因为关系是集

Composition of Relational Operations

关系代数运算的结果是关系，因此关系代数运算可以组合成一个关系代数表达式 reletional-algebra expression。

考虑这个查询------查找物理系所有教员的姓名。
∏ n a m e = ( σ d e p t . . n a m e = " P h y s i c s " " ( i n s t r u c t o r ) ) ) \prod _{name}=(\sigma _{dept..name\,=\,"Physics""}(instructor))) name∏=(σdept..name="Physics""(instructor)))

我们不给出关系的名称作为投影操作的参数，而是给出一个计算结果为关系的表达式。