结合实体类型信息(2)——基于本体的知识图谱补全深度学习方法

1 引言

1.1 问题

目前KGC和KGE提案的两个主要缺点是:(1)它们没有利用本体信息;(二)对训练时未见的事实和新鲜事物不能预测的。

1.2 解决方案

一种新的知识图嵌入初始化方法。

1.3 结合的信息

知识库中的实体向量表示+编码后的本体信息------>增强 KGC

2基于本体的知识图谱补全深度学习方法

首先提出假设,如果使用嵌入来丰富e1的初始表示,则预测实体"Barack Obama"的链接(我们称之为e1)应该更容易,该嵌入试图反映e1是一位总统,因此也就是一位政治家。此外,如果"新鲜实体"的初始表示可以处理在训练时间中看不到的实体,则"新实体"也可以接收到来源于本体的额外信息。

具体做法:

首先,本体信息或本体知识库(OKB),如概念和类,必须从一般知识库(KB)(一般存在于诸如Freebase之类的多个通用KG)中分离出来,如个体或实例。

其次,为OKB和知识库中的实体选择初始表示。使用word2vec的向量的平均值被用于实体中包含的每个词。

第三,用其对应的编码 本体信息的OKB向量扩展知识库中的每个实体向量

第四,使用诸如NTN或RESCAL等已知方法来学习KGE模型后用于KGC。

相关推荐
Master_oid14 小时前
机器学习42:线性回归基础篇
人工智能·机器学习·线性回归
anthea_luo14 小时前
机器学习中的视觉与自然语言处理
人工智能
明月照山海-14 小时前
机器学习周报四十五
人工智能·机器学习
weelinking16 小时前
【2026】08_Claude与版本控制:Git协作技巧
数据库·人工智能·git·python·数据挖掘·交互·cloudera
黄焖鸡能干四碗20 小时前
固定资产管理系统建设方案和源码(Java源码)
大数据·数据库·人工智能·物联网·区块链
颖火虫盟主20 小时前
AI DSL — 为 AI Skill 设计“自然语言脚本语法“的探索
人工智能
初学大模型20 小时前
载体的背叛:论脉冲编码在神经形态计算中的物理困境
人工智能
叶子Talk20 小时前
xAI发布Grok Build,全球AI终端展深圳开幕:AI从云端走向终端
人工智能·ai·agent·xai·grok build·终端ai
EAIReport20 小时前
Agent开发+Vibe Coding:数据本体论筑牢AI开发效率与可靠性双防线
大数据·人工智能
MediaTea21 小时前
AI 术语通俗词典:优化器
人工智能