PairRE: Knowledge Graph Embeddings via Paired Relation Vectors(论文笔记)

CCF等级:A

发布时间:2020年11月

代码位置

25年3月24日交

目录

一、简介

二、原理

1.整体

2.关系模式

3.优化模型

三、实验性能

四、结论和未来工作


一、简介

将RotatE进行生级,RotatE只对头实体h进行计算,PairRE对头尾实体都进行计算。


二、原理

1.整体

PairRE

PairRE评分函数:

每个关系 r 都由一对向量 来表示,意味着知识图谱中的每一个关系,都会有一组特定的头向量和尾向量与其对应。当同一个关系 r 在不同的三元组中出现时,它使用相同的 向量。提高了向量的利用率,并在一定程度上增加了模型的解释性。

2.关系模式

PairRE可以处理1-to-N、N-to-1、N-to-N这种复杂关系。因为PairRE将关系转化为向量对,因此可以处理对称/反对称关系、逆关系、编码组合关系、子关系。

  • **对称关系:**例如"朋友"关系。如果 e1 是 e2 的朋友,那么 e2 也是 e1 的朋友。这可以用三元组表示为:(e1,朋友,e2)∈T⇔(e2,朋友,e1)∈T。
  • **反对称关系:**例如"父亲"关系。如果 e1 是 e2 的父亲,则 e2不可能是 e1 的父亲。这可以用三元组表示为:(e1,父亲,e2)∈T⇒(e2,父亲,e1)∉T。
  • **逆关系:**例如"父亲","儿子"关系。如果 e1 是 e2 的父亲,则 e2是 e1 的儿子。这可以用三元组表示为: (e1,父亲,e2)∈T,则有 (e2,儿子,e1)∈T。
  • 组合关系: 例如"母亲的父亲"和"祖父"之间的关系。如果 e1 是 e2 的母亲,并且 e2 是 e3 的父亲,则实体 e1 是实体 e3的祖父。这用三元组表示为:
    (e1,母亲,e2)∈T并且 (e2,父亲,e3)∈T,则有 (e1,祖父,e3)∈T。
  • **子关系:**例如"父亲"和"家长"关系。如果 e1 是 e2 的父亲,则 e1 是 e2 的家长。这用三元组表示为:(e1,父亲,e2)∈T⇒(e1,家长,e2)∈T。

给定一个关系 r ,计算每个头实体的平均尾实体数(tphr)和每个尾实体的平均头实体数(hptr)。

  • ,则关系
  • ,则关系
  • ,则关系

3.优化模型

PairRE模型利用了自对抗负采样损失来优化模型。具体来说,该方法的目的是通过最大化正样本的得分同时最小化负样本的得分来训练模型。以下是PairRE使用负采样进行优化的具体步骤和公式:

其中:

  • 是一个固定边界值。
  • 是Sigmoid函数。
  • 表示第 i 个负样本三元组。
  • 表示负样本的权重,其计算方式为:

三、实验性能

表 3 展示了 ogbl-wikikg2 和 ogbl-biokg 的对比情况。在这两个大规模数据集上,PairRE 达到了最先进的性能。对于 ogbl-wikikg2 数据集,PairRE在有限嵌入维度和增加嵌入维度的情况下均表现最佳。在参数数量与 ComplEx 相同(维度为 100)的情况下,PairRE测试 MRR 提升了近 10%。

表 4 展示了 FB15k 和 FB15k-237 数据集的对比情况。由于PairRE模型与 RotatE 共享相同的超参数设置和实现方式,因此与这一最先进的模型进行比较是公平的,能够展示所提出模型的优势和不足。

文章将 RotatE 中的关系向量改为成对向量。在修改后的 RotatE 模型中,头实体和尾实体均基于成对向量以不同的角度进行旋转该模型也可以被视为基于复数值的PairRE。文章将此模型命名为 RotatE+PairRelation。实验结果如图 2 所示。在相同的嵌入维度(实验中为 50)下,RotatE+PairRelation 在 1 对1、1 对 N、N 对 1 和 N 对 N 关系类别上分别将RotatE 的性能提高了 20.8%、27.5%、14.4% 和39.1%。这些显著的改进证明了成对关系向量处理复杂关系的优越能力。

四、结论和未来工作

  1. 提高计算效率
  2. 增强关系模式表达能力
  3. 结合其他先进技术(如神经网络)
  4. 深入研究"RotatE+PairRelation"
相关推荐
苍何17 分钟前
腾讯重磅开源!混元图像 3.0 图生图真香!
人工智能
千里马也想飞20 分钟前
人工智能在医疗领域的应用与研究论文写作实操:AI辅助快速完成框架+正文创作
人工智能
Rorsion25 分钟前
PyTorch实现二分类(单特征输出+单层神经网络)
人工智能·pytorch·分类
勾股导航33 分钟前
K-means
人工智能·机器学习·kmeans
liliangcsdn34 分钟前
Diff2Flow中扩散和流匹配的对齐探索
人工智能
SmartBrain39 分钟前
战略洞察:以AI为代表的第四次工业革命
人工智能·语言模型·aigc
一个处女座的程序猿1 小时前
AI之Agent之VibeCoding:《Vibe Coding Kills Open Source》翻译与解读
人工智能·开源·vibecoding·氛围编程
Jay Kay1 小时前
GVPO:Group Variance Policy Optimization
人工智能·算法·机器学习
风指引着方向1 小时前
归约操作优化:ops-math 的 Sum/Mean/Max 实现
人工智能·wpf
机器之心1 小时前
英伟达世界模型再进化,一个模型驱动所有机器人!机器人的GPT时刻真正到来
人工智能·openai