结合实体类型信息(2)——基于本体的知识图谱补全深度学习方法

1 引言

1.1 问题

目前KGC和KGE提案的两个主要缺点是:(1)它们没有利用本体信息;(二)对训练时未见的事实和新鲜事物不能预测的。

1.2 解决方案

一种新的知识图嵌入初始化方法。

1.3 结合的信息

知识库中的实体向量表示+编码后的本体信息------>增强 KGC

2基于本体的知识图谱补全深度学习方法

首先提出假设,如果使用嵌入来丰富e1的初始表示,则预测实体"Barack Obama"的链接(我们称之为e1)应该更容易,该嵌入试图反映e1是一位总统,因此也就是一位政治家。此外,如果"新鲜实体"的初始表示可以处理在训练时间中看不到的实体,则"新实体"也可以接收到来源于本体的额外信息。

具体做法:

首先,本体信息或本体知识库(OKB),如概念和类,必须从一般知识库(KB)(一般存在于诸如Freebase之类的多个通用KG)中分离出来,如个体或实例。

其次,为OKB和知识库中的实体选择初始表示。使用word2vec的向量的平均值被用于实体中包含的每个词。

第三,用其对应的编码 本体信息的OKB向量扩展知识库中的每个实体向量

第四,使用诸如NTN或RESCAL等已知方法来学习KGE模型后用于KGC。

相关推荐
半个落月1 小时前
从 Tokenization 到 Embedding:用 Node.js 搞懂大模型为什么先“分词”再“向量化”
人工智能·node.js
vanuan1 小时前
MCP协议实战(Java版):用Spring Boot让AI直接查你的数据库
人工智能
雪隐1 小时前
个人电脑玩AI-06让5060 Ti给你打工——不光能画画,Qwen3-TTS还能学人说话,连我老板都信了!
人工智能·后端·python
Coffeeee2 小时前
帮你快速理解AI Agent之我想招个Android实习生
android·人工智能·agent
新新技术迷2 小时前
AI聊天自动跟随滚动,附回到底部按钮
人工智能
先锋部队2 小时前
用Web Worker解析AI返回的大文本不卡UI
人工智能
把你拉进白名单2 小时前
8.OpenClaw源码解析——三层洋葱重试
人工智能·llm·agent
用户632415031782 小时前
拖文档进AI对话框解析,前端要处理哪些脏活
人工智能
姗姗来迟了2 小时前
AI回答里的引用来源卡片,前端怎么做
人工智能
用户7106207733402 小时前
Codex-端口配置错误排查案例(stream disconnected before completion)
人工智能