在知识表示与知识图谱中,分类并不是随意进行的。无论是区分类与实例,还是建立上位类与下位类,背后都需要一种更基础的结构来支撑,这就是集合观念。
集合、元素、隶属关系、包含关系与相等关系,构成了知识分类最基本的数学基础。只有先理解这几个概念,后续关于概念层级、类属关系和本体建模的内容才会更清楚。
一、什么是集合,什么是元素
集合(Set)是由若干确定对象构成的整体,这些对象能够明确判断是否属于该整体。组成集合的每一个对象,称为这个集合的元素(Element)。
例如:
"所有学生"可以看作一个集合;
"所有哺乳动物"可以看作一个集合;
"所有大学"也可以看作一个集合。
如果把"哺乳动物"看作一个集合,那么"猫""狗""鲸"都可以看作这个集合中的元素。
如果把"大学"看作一个集合,那么"北京大学""湖南师范大学""哈佛大学"都可以看作这个集合中的元素。
集合强调"整体",元素强调"成员"。
因此,集合与元素的关系,不是并列关系,而是"整体---成员"的关系。
二、集合的表示方法
集合通常有两种基本表示方法:枚举法和谓词法。
1、枚举法
枚举法(Roster Form)是把集合中的元素一个个列出来。
例如:
go
{1, 2, 3, 4, 5}
go
{猫, 狗, 马}
这种方法直观清楚,适合元素数量较少、范围明确的情况。
2、谓词法
谓词法(Predicate Form)不是直接列出元素,而是用一个条件来说明"什么样的对象属于这个集合"。它也可以理解为一种条件表示法。
例如:
nginx
{x | x 是自然数}{x | x 是大学}{x | x 是哺乳动物}
这种方法更适合描述范围较大、成员较多或无法一一列举的集合。
在知识分类中,谓词法尤其重要。因为很多类别并不是靠逐个列举对象来确定的,而是靠某种共同条件或共同特征来界定。
三、什么是隶属关系
隶属关系(Membership)描述的是"某个对象是不是某个集合的成员"。
通常记作:a ∈ A
意思是:对象 a 属于集合 A。
例如:
go
猫 ∈ 哺乳动物北京大学 ∈ 大学梵高 ∈ 画家
这里的"哺乳动物""大学""画家",都可以理解为按类别形成的集合。
如果某个对象不属于某个集合,则记作:a ∉ A
例如:
go
鲸 ∉ 鸟类苹果公司 ∉ 大学
隶属关系的核心,是判断一个具体对象是否属于某个类别。
从知识图谱角度看,这种关系与"实例属于某类"非常接近。因此,隶属关系可以看作理解"类---实例"关系的重要基础。
四、什么是包含关系
包含关系(Inclusion)描述的是"一个集合中的所有元素是否都属于另一个集合"。
通常记作:A ⊆ B
意思是:集合 A 中的每一个元素,也都属于集合 B。
也就是说,A 被包含在 B 中,或者说 A 是 B 的子集(Subset)。
例如:
go
哺乳动物 ⊆ 动物大学教师 ⊆ 教师印象派画家 ⊆ 画家
包含关系强调的是"集合与集合之间"的范围关系,而不是"对象与集合之间"的成员关系。
因此,要特别区分:
猫 ∈ 哺乳动物 是隶属关系;
哺乳动物 ⊆ 动物 是包含关系。
这是学习知识分类时最容易混淆的一点。
五、集合的相等关系
集合的相等关系(Equality of Sets)描述的是两个集合是否包含完全相同的元素。
通常记作:A = B
这表示集合 A 和集合 B 的元素完全相同。
例如:
go
{1, 2, 3} = {3, 2, 1}
go
所有哺乳动物的集合 = 由全部哺乳动物构成的集合
需要注意,集合是否相等,不取决于元素书写顺序,也不取决于集合名称是否不同,而只取决于它们所包含的元素是否完全一致。
集合相等还可以借助包含关系来判断:
如果 A ⊆ B,且 B ⊆ A,那么 A = B。
这说明,集合相等本质上可以看作一种"双向包含"关系。
在知识分类中,这一点提醒我们:两个类别如果名称不同,但对象范围完全一致,那么它们在分类范围上并没有实质区别。
六、隶属与包含有什么区别
隶属和包含都表示"属于",但它们讨论的对象层次不同。虽然在自然语言中都可以说成"属于"或"归入",但在数学意义上,它们表示的是不同的结构关系。
隶属:讨论"元素与集合"的关系;
包含:讨论"集合与集合"的关系。
可以用下图做一个简单区分:

在这个示意中:
"猫"是具体对象,和"哺乳动物"之间是隶属关系;
"哺乳动物"与"动物"都是集合,二者之间是包含关系。
如果把这两种关系混在一起,就会导致分类结构混乱。
例如,把"某只猫属于哺乳动物"和"哺乳动物属于动物这一大类"理解为同一种关系,就会模糊实例与类别、下位类与上位类之间的区别。
七、集合观念是知识分类的基础
知识分类本质上是在回答两个问题:
哪些对象属于同一类;
各类之间是什么层级关系。
这两个问题,在形式上可以分别借助隶属关系和包含关系来表达。
因此,集合观念之所以重要,是因为它为知识分类提供了最基本的结构框架。
1、帮助确定对象归属
通过隶属关系,可以判断某个对象属于哪个类别。
2、帮助建立类别层级
通过包含关系,可以建立上位类与下位类的结构。
3、帮助保持分类的清晰性
如果没有集合观念,分类就容易变成随意罗列;有了集合、元素、隶属和包含,分类才能具有明确边界。
4、为后续建模提供基础
知识图谱中的类、实例、子类、成员关系,都可以在一定程度上借助集合观念来理解。
因此,集合不是纯粹的数学附属知识,而是知识组织与知识表示的重要基础。
八、从集合到知识图谱中的类与实例
在初学阶段中,可以把"类"近似理解为一个集合,把"实例"近似理解为这个集合中的元素,但这种对应只是帮助理解的简化模型,并不是完全等同。
例如:
go
类:科学家实例:牛顿、爱因斯坦、居里夫人
又如:
go
类:大学实例:北京大学、湖南师范大学、牛津大学
而当两个类之间存在范围上的从属关系时,就可以近似对应为集合之间的包含关系:
• 理工大学 ⊆ 大学
• 哺乳动物 ⊆ 动物
当然,知识图谱中的类和实例并不完全等同于数学集合和元素,但集合观念提供了一个非常清楚的入门框架。
借助它,我们可以更容易理解:
什么是类;
什么是实例;
什么是子类;
为什么分类体系能够形成层级结构。
这也说明,集合、元素、隶属与包含,不只是数学概念,更是知识分类和知识图谱建模的基础语言。
📘 小结
集合表示一个对象整体,元素表示其中的成员;隶属描述元素与集合的关系,包含描述集合与集合的关系,相等关系描述两个集合是否具有完全相同的元素。理解这组概念,有助于把握类、实例和层级结构的基础逻辑。

"点赞有美意,赞赏是鼓励"