函数依赖:
关系数据库的规范化理论是数据库逻辑设计的工具。
关系模式由五部分组成,是一个五元组: R(U, D, DOM, F)
关系名 R 是符号化的元组语义
U 为一组属性
D 为属性组 U 中的属性所来自的域
DOM 为属性到域的映射
F 为属性组 U 上的一组数据依赖
当且仅当 U 上的一个关系 r 满足 F 时, r 称为关系模式 R<U,F>
的一个关系。
作为二维表,关系要符合一个最基本的条件:每个分量必须
是不可分开的数据项。满足了这个条件的关系模式就属于第
一范式( 1NF )。
数据依赖的类型包括:多值依赖(MVD(Multi-Valued Dependency))和函数依赖(FD(Functional Dependency))。
函数依赖的实例:描述一个学生关系,可以有学号,姓名,系名等属性。
一个学号对应一个学生,一个学生只在一个系中学习。
学号确定后,学生的姓名和所在的系被唯一的确定。
Sname=f(Sno) , Sdept=f(Sno)
即 Sno 函数决定 Sname
Sno 函数决定 Sdept
记作 Sno→Sname , Sno→Sdept
根据现实世界的已知事实:
一个系有若干学生, 但一个学生只属于一个系;
一个系只有一名(正职)负责人;
一个学生可以选修多门课程,每门课程有若干学生选修;
每个学生学习每一门课程有一个成绩。
我们可以得到在属性组U上的一组函数依赖F:
F={ Sno→Sdept, Sdept→ Mname, ( Sno, Cno)→ Grade }
也就是:
看一下我们实例化后的表格:
但是这个学生关系存在以下问题:
1,数据冗余高,系名,系主任名重复出现。
2,更新异常,更新数据付出代价比较大,更换系主任后,所有条目都要更新。
3,插入异常,一个元组在主键的属性上存在空时,该元组无法插入。(一个系刚成立,还没有学生,无法插入)。
4,删除异常,删除了不应被删除的数据(学生全部离去,系主任信息也会被删除)。
显然,这不是我们追求的高效的模式,高效的模式要保证插入,删除,更新正常,而且数据冗余要尽可能少。
我们可以通过分解数据模式来消除其中不合适的数据依赖。
试想:
我们先来解释一下概念:
函数依赖 functional dependency, abbr. FD
设: R ( A1 , A2 , ...An)=R( U )
X , Y 为 U 的不同子集
r 是 R 的任一具体关系
s,t 是 r 的任意两个元组
① 函数依赖 是完整性约束的一种,它推广了关键字
的概念。 If s[X]=t[X], then s[Y]=t[Y]
② 函数依赖 :若 R 的任意关系有:对 X 中的每个属性值,
在 Y 中都有惟一的值与之对应,则称 Y 函数依赖于 X ,
记作 X -> Y 。
函数依赖指的是关系模式R的所有实例都要满足约束条件。
给出例子会方便理解:
这里是函数依赖的有:AB->C,C->A。
为什么A->C,AB->D不是呢?
显然,C不依赖与A,D也不依赖于AB。
对于a1,有c1,c2与之对应,对于a1b1,有d1,d2与之对应,不存在依赖关系。
PPT看到第20页,明天继续,任务:更新关系数据库理论和操作系统,现在先去跑步。