结合实体类型信息(2)——基于本体的知识图谱补全深度学习方法

1 引言

1.1 问题

目前KGC和KGE提案的两个主要缺点是:(1)它们没有利用本体信息;(二)对训练时未见的事实和新鲜事物不能预测的。

1.2 解决方案

一种新的知识图嵌入初始化方法。

1.3 结合的信息

知识库中的实体向量表示+编码后的本体信息------>增强 KGC

2基于本体的知识图谱补全深度学习方法

首先提出假设,如果使用嵌入来丰富e1的初始表示,则预测实体"Barack Obama"的链接(我们称之为e1)应该更容易,该嵌入试图反映e1是一位总统,因此也就是一位政治家。此外,如果"新鲜实体"的初始表示可以处理在训练时间中看不到的实体,则"新实体"也可以接收到来源于本体的额外信息。

具体做法:

首先,本体信息或本体知识库(OKB),如概念和类,必须从一般知识库(KB)(一般存在于诸如Freebase之类的多个通用KG)中分离出来,如个体或实例。

其次,为OKB和知识库中的实体选择初始表示。使用word2vec的向量的平均值被用于实体中包含的每个词。

第三,用其对应的编码 本体信息的OKB向量扩展知识库中的每个实体向量

第四,使用诸如NTN或RESCAL等已知方法来学习KGE模型后用于KGC。

相关推荐
摘星编程9 分钟前
CANN内存管理机制:从分配策略到性能优化
人工智能·华为·性能优化
likerhood16 分钟前
3. pytorch中数据集加载和处理
人工智能·pytorch·python
Robot侠17 分钟前
ROS1从入门到精通 10:URDF机器人建模(从零构建机器人模型)
人工智能·机器人·ros·机器人操作系统·urdf机器人建模
haiyu_y18 分钟前
Day 46 TensorBoard 使用介绍
人工智能·深度学习·神经网络
阿里云大数据AI技术23 分钟前
DataWorks 又又又升级了,这次我们通过 Arrow 列存格式让数据同步速度提升10倍!
大数据·人工智能
做科研的周师兄24 分钟前
中国土壤有机质数据集
人工智能·算法·机器学习·分类·数据挖掘
IT一氪25 分钟前
一款 AI 驱动的 Word 文档翻译工具
人工智能·word
lovingsoft28 分钟前
Vibe coding 氛围编程
人工智能
百***074533 分钟前
GPT-Image-1.5 极速接入全流程及关键要点
人工智能·gpt·计算机视觉
yiersansiwu123d1 小时前
AI二创的版权迷局与健康生态构建之道
人工智能