结合实体类型信息(2)——基于本体的知识图谱补全深度学习方法

1 引言

1.1 问题

目前KGC和KGE提案的两个主要缺点是:(1)它们没有利用本体信息;(二)对训练时未见的事实和新鲜事物不能预测的。

1.2 解决方案

一种新的知识图嵌入初始化方法。

1.3 结合的信息

知识库中的实体向量表示+编码后的本体信息------>增强 KGC

2基于本体的知识图谱补全深度学习方法

首先提出假设,如果使用嵌入来丰富e1的初始表示,则预测实体"Barack Obama"的链接(我们称之为e1)应该更容易,该嵌入试图反映e1是一位总统,因此也就是一位政治家。此外,如果"新鲜实体"的初始表示可以处理在训练时间中看不到的实体,则"新实体"也可以接收到来源于本体的额外信息。

具体做法:

首先,本体信息或本体知识库(OKB),如概念和类,必须从一般知识库(KB)(一般存在于诸如Freebase之类的多个通用KG)中分离出来,如个体或实例。

其次,为OKB和知识库中的实体选择初始表示。使用word2vec的向量的平均值被用于实体中包含的每个词。

第三,用其对应的编码 本体信息的OKB向量扩展知识库中的每个实体向量

第四,使用诸如NTN或RESCAL等已知方法来学习KGE模型后用于KGC。

相关推荐
AI刀刀几秒前
Kimi 保存 pdf 显示该页的尺寸超出范围令人困扰,AI 导出鸭一键修复参数,导出 PDF 更顺畅
人工智能·pdf·ai导出鸭
冬奇Lab40 分钟前
Agent 系列(13):Agent 安全与防护——提示词注入、工具滥用、数据泄露怎么防
人工智能·llm·agent
冬奇Lab42 分钟前
每日一个开源项目(第122篇):headroom - 给 AI Agent 装上上下文压缩层,Token 最高省 95%
人工智能·开源·资讯
科技与数码1 小时前
鸿蒙6.1小艺伴随式AI体验:让阅读效率翻倍
人工智能·华为·harmonyos
实在智能RPA1 小时前
药企GMP合规自动化破局:实在Agent的功能完整度评估与落地实践
运维·人工智能·ai·自动化
市象1 小时前
当 Google I/O 出现在抖音,前沿科技有了新现场
人工智能·科技
程序猿追1 小时前
棋盘上的博弈:我在 HarmonyOS 里塞了一个五子棋“大脑”
人工智能·华为·harmonyos
是烨笙啊2 小时前
在 Claude code 中如何利用模型缓存节省 token
人工智能·缓存·ai编程
薛定猫AI2 小时前
【深度解析】从 Claude Mythos 争议看大模型落地:幻觉、Benchmark、成本墙与安全边界
人工智能