结合实体类型信息(2)——基于本体的知识图谱补全深度学习方法

StandByMe.(备考期末版，暂不)2024-07-16 21:04

1 引言

目前KGC和KGE提案的两个主要缺点是:(1)它们没有利用本体信息;(二)对训练时未见的事实和新鲜事物不能预测的。

一种新的知识图嵌入初始化方法。

知识库中的实体向量表示＋编码后的本体信息------>增强 KGC

首先提出假设，如果使用嵌入来丰富e1的初始表示，则预测实体"Barack Obama"的链接(我们称之为e1)应该更容易，该嵌入试图反映e1是一位总统，因此也就是一位政治家。此外，如果"新鲜实体"的初始表示可以处理在训练时间中看不到的实体，则"新实体"也可以接收到来源于本体的额外信息。

具体做法：

首先，本体信息或本体知识库(OKB)，如概念和类，必须从一般知识库(KB)（一般存在于诸如Freebase之类的多个通用KG）中分离出来，如个体或实例。

其次，为OKB和知识库中的实体选择初始表示。使用word2vec的向量的平均值被用于实体中包含的每个词。

第三，用其对应的编码 本体信息的OKB向量扩展知识库中的每个实体向量。

第四，使用诸如NTN或RESCAL等已知方法来学习KGE模型后用于KGC。