知识图谱 04:知识表示模型

继续沿用前面的任务。我们要做一个科技史知识服务系统,并希望它能回答:

go 复制代码
詹姆斯·瓦特(James Watt)是谁?James Watt 与蒸汽机(steam engine)是什么关系?James Watt 属于哪一类人物?为什么系统还能根据已有知识推出新结论?

前面已经说明,知识图谱需要合适的知识表示方法。

但在真正落地时,还要进一步回答一个问题:这些知识具体应该用什么模型来表示。

不同模型的重点并不相同:有的强调事实表达,有的强调类别结构,有的强调本体约束,有的强调工程实现,有的强调计算与学习。

一、知识图谱表示模型的必要性

如果系统只把知识写成普通文本,那么"James Watt improved the steam engine"这样的内容虽然人能看懂,机器却不容易稳定处理。

它很难直接知道:

James Watt 是一个实体;

improved 是一个关系;

steam engine 是另一个实体;

这条知识还能与其他知识继续连接。

因此,知识图谱不能只依赖自然语言描述,而需要更清楚的表示模型,把实体、关系、类别、属性和约束写成结构化形式。

只有这样,系统才能更稳定地组织知识、执行查询,并在已有知识基础上支持进一步推断。

二、RDF:事实表示层

如果先从最基础的问题入手:"怎样把知识写成统一结构?"

常见答案就是 RDF(Resource Description Framework,资源描述框架)。

RDF 的核心思想很简单:把知识写成三元组(triple),也就是"主体---谓词---客体"的结构。

例如,在当前任务里,可以写成:

javascript 复制代码
James Watt --- improved --- steam engineJames Watt --- connected with --- University of GlasgowJames Watt --- associated with --- Industrial Revolution

RDF 解决的是知识图谱最基础的一层:怎样把事实写出来。

它把原本分散在文本中的知识,转化为统一、可连接的结构化表达。

延伸阅读:

资源描述框架(RDF):三元组、资源与图结构

三、RDFS:模式表示层

如果只有 RDF,系统虽然能写出事实,但还不够清楚这些事实属于什么结构。

例如,系统也许知道"James Watt --- improved --- steam engine",但还不知道:

nginx 复制代码
James Watt 属于 engineer;engineer 是 person 的子类;University of Glasgow 属于 university;improved 通常连接某类人物与某类技术对象。

这时,就需要 RDFS(RDF Schema,RDF 架构描述语言)。

RDFS 解决的是:怎样把事实放进类、属性及其层级结构中。

它在 RDF 基础上进一步引入类(class)、属性(property)、子类关系、定义域(domain)和值域(range)等内容,使知识图谱从"事实记录"进一步上升到"模式表达"。

延伸阅读:

RDF 架构描述语言(RDFS):类、属性与模式层

四、OWL:本体表示层

RDFS 已经能表示类别和属性结构,但如果系统还要进一步知道:

哪些类之间存在更强的语义关系;

某个属性具有什么逻辑特性;

某些知识在什么条件下可以自动推出;

那么仅有 RDFS 还不够。这时,就需要 OWL(Web Ontology Language,网络本体语言)。

OWL 更接近知识图谱中的本体层。

它的重点不再只是"有哪些类和属性",而是"这些类和属性还遵守哪些更强的语义规则"。

例如,在更强的语义建模中,系统可以进一步表达:

某两个类别互不重叠;

某个属性具有对称性或传递性;

某个实体只要满足一组条件,就可以归入某一类别。

因此,OWL 的价值不只是"再多写一些类别关系",而是让知识图谱具有更明确的语义约束和更丰富的推理能力。

延伸阅读:

什么是本体:从概念体系到形式化建模

网络本体语言(OWL):本体、约束与推理

五、属性图模型

如果前面的 RDF / RDFS / OWL 更偏语义表达和形式化建模,那么属性图(Property Graph)则更偏工程实现。

属性图的基本思想也很直观:

(1)用节点表示实体;

(2)用边表示关系;

(3)让节点和边都可以直接携带属性。

在我们的任务里,属性图可以这样理解:

• 节点:James Watt、steam engine、University of Glasgow、Industrial Revolution

• 边:improved、connected with、associated with

• 属性:birth year、type、period 等

属性图的优势在于建模灵活、遍历方便,很适合图数据库和关系分析任务。它不像 RDF 那样以三元组为统一单位,而是更强调"节点---边---属性"的整体工程结构。

因此,属性图通常更适合图数据库中的查询、遍历和工程开发,而 RDF 更强调语义互操作与形式化表达。

延伸阅读:

属性图:节点、边与属性的图模型

六、向量空间表示

前面几种模型主要都属于显式符号表示。但如果系统还要进一步完成:

相似性计算;

链接预测;

知识补全;

与机器学习模型结合;

那么还需要另一种表示方式:向量空间表示(Embedding)。

向量表示的基本思想,是把实体和关系映射到向量空间中。

例如:

nginx 复制代码
James Watt 可以表示为一个向量;steam engine 可以表示为一个向量;improved 也可以表示为一个向量。

这样,知识图谱中的实体和关系就不再只是符号,还变成了一组可计算的数字表示。

这类表示的重点不是直接给人阅读,而是让机器更高效地学习、比较和预测。

需要注意的是,向量表示并不是对前面符号模型的简单替代,而更像是一种面向计算学习的补充表示方式。

在很多实际系统中,显式符号表示与向量表示往往会结合使用。

延伸阅读:

向量空间表示:如何把实体和关系表示为向量

七、表示模型的层次与比较

到这里,可以把这几种模型放在一起看:

RDF 解决:怎样把事实写出来;

RDFS 解决:怎样把事实放入类别和属性结构;

OWL 解决:怎样加入更强语义约束和推理;

属性图解决:怎样以更灵活的方式进行工程建模;

向量表示解决:怎样把知识转成可学习、可计算的形式。

下面这张图可以概括这些表示模型的大致分工:

不同模型解决的是不同层面的问题。

真正的系统往往不是只依赖其中之一,而是根据任务目标,在语义表达、工程实现和计算学习之间做出选择和组合。

延伸阅读:

RDF、RDFS、OWL 三者是什么关系

📘 小结

知识图谱的表示模型各有分工。RDF 负责事实表达,RDFS 负责模式结构,OWL 负责本体约束与推理,属性图偏向工程建模,向量表示偏向计算与学习。真正的知识图谱系统,通常需要根据任务要求,对这些模型进行选择、组合与配合。

"点赞有美意,赞赏是鼓励"

相关推荐
词元Max2 小时前
Java 转 AI Agent 开发学习路线(2026年3月最新版)
java·人工智能·学习
实在智能RPA2 小时前
Agent如何帮助企业减少人为操作失误?——2026年企业级智能体闭环执行与风险治理深度拆解
人工智能·ai
数字卢语2 小时前
如何从 0 搭建 Hermes Agent,并打通微信的(完整踩坑与排错记录)
人工智能
程序员勋勋12 小时前
使用claude code时,为什么token消费会突然一下变高
人工智能
五点钟科技2 小时前
LLaVA 论文精读以及源码网络结构完整分析
人工智能·多模态·clip·llava
Gofarlic_OMS2 小时前
应对MathWorks合规审查的专项准备工作
大数据·服务器·网络·数据库·人工智能
-cywen-2 小时前
VAE(Variational AutoEncoder)
人工智能·深度学习
05大叔2 小时前
词向量化和文本向量化,KMeans
人工智能·机器学习
云空2 小时前
《Hermes Agent 部署与使用中的安全漏洞分析及解决办法》
网络·人工智能·安全