结合实体类型信息(2)——基于本体的知识图谱补全深度学习方法

1 引言

1.1 问题

目前KGC和KGE提案的两个主要缺点是:(1)它们没有利用本体信息;(二)对训练时未见的事实和新鲜事物不能预测的。

1.2 解决方案

一种新的知识图嵌入初始化方法。

1.3 结合的信息

知识库中的实体向量表示+编码后的本体信息------>增强 KGC

2基于本体的知识图谱补全深度学习方法

首先提出假设,如果使用嵌入来丰富e1的初始表示,则预测实体"Barack Obama"的链接(我们称之为e1)应该更容易,该嵌入试图反映e1是一位总统,因此也就是一位政治家。此外,如果"新鲜实体"的初始表示可以处理在训练时间中看不到的实体,则"新实体"也可以接收到来源于本体的额外信息。

具体做法:

首先,本体信息或本体知识库(OKB),如概念和类,必须从一般知识库(KB)(一般存在于诸如Freebase之类的多个通用KG)中分离出来,如个体或实例。

其次,为OKB和知识库中的实体选择初始表示。使用word2vec的向量的平均值被用于实体中包含的每个词。

第三,用其对应的编码 本体信息的OKB向量扩展知识库中的每个实体向量

第四,使用诸如NTN或RESCAL等已知方法来学习KGE模型后用于KGC。

相关推荐
Aleeeeex7 小时前
RAG 那点事:从 8 份企业文档到能用的问答系统,全过程拆给你看
人工智能·python·ai编程
冬奇Lab8 小时前
一天一个开源项目(第87篇):Tank-OS —— Red Hat 工程师用一个周末,把 AI Agent 塞进了一个可启动的 Linux 镜像
人工智能·开源·资讯
小糖学代码8 小时前
LLM系列:2.pytorch入门:8.神经网络的损失函数(criterion)
人工智能·深度学习·神经网络
Captaincc8 小时前
转发-中央网信办部署开展“清朗·整治AI应用乱象”专项行动
人工智能·vibecoding
AI自动化工坊8 小时前
Late框架技术深度解析:5GB VRAM实现10倍AI编码效率的工程架构
人工智能·5g·架构·ai编程·late
我是大聪明.8 小时前
DeepSeek V4 Pro + 华为昇腾910:国产大模型落地的性能实测与深度解析
人工智能·华为
机器之心9 小时前
Generalist之后,罗剑岚团队推出LWD,也要变革具身智能训练范式
人工智能·openai
IT_陈寒9 小时前
Vite的public文件夹放静态资源?这坑我替你踩了
前端·人工智能·后端
传说故事9 小时前
【论文阅读】Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion
论文阅读·人工智能·diffusion
xixixi777779 小时前
三重筑基:5G-A超级上行提速千兆,电联低频共享扫平盲点,800V HVDC算电协同破局
人工智能·5g·ai·大模型·算力·通信·信通院