集合、元素、隶属与包含:知识分类的数学基础

在知识表示与知识图谱中,分类并不是随意进行的。无论是区分类与实例,还是建立上位类与下位类,背后都需要一种更基础的结构来支撑,这就是集合观念。

集合、元素、隶属关系、包含关系与相等关系,构成了知识分类最基本的数学基础。只有先理解这几个概念,后续关于概念层级、类属关系和本体建模的内容才会更清楚。

一、什么是集合,什么是元素

集合(Set)是由若干确定对象构成的整体,这些对象能够明确判断是否属于该整体。组成集合的每一个对象,称为这个集合的元素(Element)。

例如:

"所有学生"可以看作一个集合;

"所有哺乳动物"可以看作一个集合;

"所有大学"也可以看作一个集合。

如果把"哺乳动物"看作一个集合,那么"猫""狗""鲸"都可以看作这个集合中的元素。

如果把"大学"看作一个集合,那么"北京大学""湖南师范大学""哈佛大学"都可以看作这个集合中的元素。

集合强调"整体",元素强调"成员"。

因此,集合与元素的关系,不是并列关系,而是"整体---成员"的关系。

二、集合的表示方法

集合通常有两种基本表示方法:枚举法和谓词法。

1、枚举法

枚举法(Roster Form)是把集合中的元素一个个列出来。

例如:

go 复制代码
{1, 2, 3, 4, 5}
go 复制代码
{猫, 狗, 马}

这种方法直观清楚,适合元素数量较少、范围明确的情况。

2、谓词法

谓词法(Predicate Form)不是直接列出元素,而是用一个条件来说明"什么样的对象属于这个集合"。它也可以理解为一种条件表示法。

例如:

nginx 复制代码
{x | x 是自然数}{x | x 是大学}{x | x 是哺乳动物}

这种方法更适合描述范围较大、成员较多或无法一一列举的集合。

在知识分类中,谓词法尤其重要。因为很多类别并不是靠逐个列举对象来确定的,而是靠某种共同条件或共同特征来界定。

三、什么是隶属关系

隶属关系(Membership)描述的是"某个对象是不是某个集合的成员"。

通常记作:a ∈ A

意思是:对象 a 属于集合 A。

例如:

go 复制代码
猫 ∈ 哺乳动物北京大学 ∈ 大学梵高 ∈ 画家

这里的"哺乳动物""大学""画家",都可以理解为按类别形成的集合。

如果某个对象不属于某个集合,则记作:a ∉ A

例如:

go 复制代码
鲸 ∉ 鸟类苹果公司 ∉ 大学

隶属关系的核心,是判断一个具体对象是否属于某个类别。

从知识图谱角度看,这种关系与"实例属于某类"非常接近。因此,隶属关系可以看作理解"类---实例"关系的重要基础。

四、什么是包含关系

包含关系(Inclusion)描述的是"一个集合中的所有元素是否都属于另一个集合"。

通常记作:A ⊆ B

意思是:集合 A 中的每一个元素,也都属于集合 B。

也就是说,A 被包含在 B 中,或者说 A 是 B 的子集(Subset)。

例如:

go 复制代码
哺乳动物 ⊆ 动物大学教师 ⊆ 教师印象派画家 ⊆ 画家

包含关系强调的是"集合与集合之间"的范围关系,而不是"对象与集合之间"的成员关系。

因此,要特别区分:

猫 ∈ 哺乳动物 是隶属关系;

哺乳动物 ⊆ 动物 是包含关系。

这是学习知识分类时最容易混淆的一点。

五、集合的相等关系

集合的相等关系(Equality of Sets)描述的是两个集合是否包含完全相同的元素。

通常记作:A = B

这表示集合 A 和集合 B 的元素完全相同。

例如:

go 复制代码
{1, 2, 3} = {3, 2, 1}
go 复制代码
所有哺乳动物的集合 = 由全部哺乳动物构成的集合

需要注意,集合是否相等,不取决于元素书写顺序,也不取决于集合名称是否不同,而只取决于它们所包含的元素是否完全一致。

集合相等还可以借助包含关系来判断:

如果 A ⊆ B,且 B ⊆ A,那么 A = B。

这说明,集合相等本质上可以看作一种"双向包含"关系。

在知识分类中,这一点提醒我们:两个类别如果名称不同,但对象范围完全一致,那么它们在分类范围上并没有实质区别。

六、隶属与包含有什么区别

隶属和包含都表示"属于",但它们讨论的对象层次不同。虽然在自然语言中都可以说成"属于"或"归入",但在数学意义上,它们表示的是不同的结构关系。

隶属:讨论"元素与集合"的关系;

包含:讨论"集合与集合"的关系。

可以用下图做一个简单区分:

在这个示意中:

"猫"是具体对象,和"哺乳动物"之间是隶属关系;

"哺乳动物"与"动物"都是集合,二者之间是包含关系。

如果把这两种关系混在一起,就会导致分类结构混乱。

例如,把"某只猫属于哺乳动物"和"哺乳动物属于动物这一大类"理解为同一种关系,就会模糊实例与类别、下位类与上位类之间的区别。

七、集合观念是知识分类的基础

知识分类本质上是在回答两个问题:

哪些对象属于同一类;

各类之间是什么层级关系。

这两个问题,在形式上可以分别借助隶属关系和包含关系来表达。

因此,集合观念之所以重要,是因为它为知识分类提供了最基本的结构框架。

1、帮助确定对象归属

通过隶属关系,可以判断某个对象属于哪个类别。

2、帮助建立类别层级

通过包含关系,可以建立上位类与下位类的结构。

3、帮助保持分类的清晰性

如果没有集合观念,分类就容易变成随意罗列;有了集合、元素、隶属和包含,分类才能具有明确边界。

4、为后续建模提供基础

知识图谱中的类、实例、子类、成员关系,都可以在一定程度上借助集合观念来理解。

因此,集合不是纯粹的数学附属知识,而是知识组织与知识表示的重要基础。

八、从集合到知识图谱中的类与实例

在初学阶段中,可以把"类"近似理解为一个集合,把"实例"近似理解为这个集合中的元素,但这种对应只是帮助理解的简化模型,并不是完全等同。

例如:

go 复制代码
类:科学家实例:牛顿、爱因斯坦、居里夫人

又如:

go 复制代码
类:大学实例:北京大学、湖南师范大学、牛津大学

而当两个类之间存在范围上的从属关系时,就可以近似对应为集合之间的包含关系:

• 理工大学 ⊆ 大学

• 哺乳动物 ⊆ 动物

当然,知识图谱中的类和实例并不完全等同于数学集合和元素,但集合观念提供了一个非常清楚的入门框架。

借助它,我们可以更容易理解:

什么是类;

什么是实例;

什么是子类;

为什么分类体系能够形成层级结构。

这也说明,集合、元素、隶属与包含,不只是数学概念,更是知识分类和知识图谱建模的基础语言。

📘 小结

集合表示一个对象整体,元素表示其中的成员;隶属描述元素与集合的关系,包含描述集合与集合的关系,相等关系描述两个集合是否具有完全相同的元素。理解这组概念,有助于把握类、实例和层级结构的基础逻辑。

"点赞有美意,赞赏是鼓励"