PairRE: Knowledge Graph Embeddings via Paired Relation Vectors(论文笔记)

CCF等级:A

发布时间:2020年11月

代码位置

25年3月24日交

目录

一、简介

二、原理

1.整体

2.关系模式

3.优化模型

三、实验性能

四、结论和未来工作


一、简介

将RotatE进行生级,RotatE只对头实体h进行计算,PairRE对头尾实体都进行计算。


二、原理

1.整体

PairRE

PairRE评分函数:

每个关系 r 都由一对向量 来表示,意味着知识图谱中的每一个关系,都会有一组特定的头向量和尾向量与其对应。当同一个关系 r 在不同的三元组中出现时,它使用相同的 向量。提高了向量的利用率,并在一定程度上增加了模型的解释性。

2.关系模式

PairRE可以处理1-to-N、N-to-1、N-to-N这种复杂关系。因为PairRE将关系转化为向量对,因此可以处理对称/反对称关系、逆关系、编码组合关系、子关系。

  • **对称关系:**例如"朋友"关系。如果 e1 是 e2 的朋友,那么 e2 也是 e1 的朋友。这可以用三元组表示为:(e1,朋友,e2)∈T⇔(e2,朋友,e1)∈T。
  • **反对称关系:**例如"父亲"关系。如果 e1 是 e2 的父亲,则 e2不可能是 e1 的父亲。这可以用三元组表示为:(e1,父亲,e2)∈T⇒(e2,父亲,e1)∉T。
  • **逆关系:**例如"父亲","儿子"关系。如果 e1 是 e2 的父亲,则 e2是 e1 的儿子。这可以用三元组表示为: (e1,父亲,e2)∈T,则有 (e2,儿子,e1)∈T。
  • 组合关系: 例如"母亲的父亲"和"祖父"之间的关系。如果 e1 是 e2 的母亲,并且 e2 是 e3 的父亲,则实体 e1 是实体 e3的祖父。这用三元组表示为:
    (e1,母亲,e2)∈T并且 (e2,父亲,e3)∈T,则有 (e1,祖父,e3)∈T。
  • **子关系:**例如"父亲"和"家长"关系。如果 e1 是 e2 的父亲,则 e1 是 e2 的家长。这用三元组表示为:(e1,父亲,e2)∈T⇒(e1,家长,e2)∈T。

给定一个关系 r ,计算每个头实体的平均尾实体数(tphr)和每个尾实体的平均头实体数(hptr)。

  • ,则关系
  • ,则关系
  • ,则关系

3.优化模型

PairRE模型利用了自对抗负采样损失来优化模型。具体来说,该方法的目的是通过最大化正样本的得分同时最小化负样本的得分来训练模型。以下是PairRE使用负采样进行优化的具体步骤和公式:

其中:

  • 是一个固定边界值。
  • 是Sigmoid函数。
  • 表示第 i 个负样本三元组。
  • 表示负样本的权重,其计算方式为:

三、实验性能

表 3 展示了 ogbl-wikikg2 和 ogbl-biokg 的对比情况。在这两个大规模数据集上,PairRE 达到了最先进的性能。对于 ogbl-wikikg2 数据集,PairRE在有限嵌入维度和增加嵌入维度的情况下均表现最佳。在参数数量与 ComplEx 相同(维度为 100)的情况下,PairRE测试 MRR 提升了近 10%。

表 4 展示了 FB15k 和 FB15k-237 数据集的对比情况。由于PairRE模型与 RotatE 共享相同的超参数设置和实现方式,因此与这一最先进的模型进行比较是公平的,能够展示所提出模型的优势和不足。

文章将 RotatE 中的关系向量改为成对向量。在修改后的 RotatE 模型中,头实体和尾实体均基于成对向量以不同的角度进行旋转该模型也可以被视为基于复数值的PairRE。文章将此模型命名为 RotatE+PairRelation。实验结果如图 2 所示。在相同的嵌入维度(实验中为 50)下,RotatE+PairRelation 在 1 对1、1 对 N、N 对 1 和 N 对 N 关系类别上分别将RotatE 的性能提高了 20.8%、27.5%、14.4% 和39.1%。这些显著的改进证明了成对关系向量处理复杂关系的优越能力。

四、结论和未来工作

  1. 提高计算效率
  2. 增强关系模式表达能力
  3. 结合其他先进技术(如神经网络)
  4. 深入研究"RotatE+PairRelation"
相关推荐
月落星还在37 分钟前
AI学习——卷积神经网络(CNN)入门
人工智能·学习·cnn
电鱼智能的电小鱼43 分钟前
eFish-SBC-RK3576 工业HMI硬件方案设计
大数据·人工智能·嵌入式硬件·智慧城市·边缘计算
张飞飞飞飞飞2 小时前
目标检测——清洗数据
人工智能·目标检测·计算机视觉
大博士.J5 小时前
MySQL实现全量同步和增量同步到SQL Server或其他关系型库
数据仓库·人工智能·python·mysql·adb
说私域6 小时前
技术革命、需求升级与商业生态迭代——基于开源AI大模型与智能商业范式的创新研究
人工智能·微信·小程序·开源·零售
Lichenpar6 小时前
AI小白的第七天:必要的数学知识(四)
人工智能·概率论·概率分布
訾博ZiBo6 小时前
AI日报 - 2025年3月21日
人工智能
LitchiCheng8 小时前
DQN 玩 2048 实战|第二期!设计 ε 贪心策略神经网络,简单训练一下吧!
人工智能·深度学习·神经网络
tortorish8 小时前
PyTorch中Batch Normalization1d的实现与手动验证
人工智能·pytorch·batch
wwwzhouhui8 小时前
dify案例分享-儿童故事绘本语音播报视频工作流
人工智能·音视频·语音识别