【论文笔记】Unifying Large Language Models and Knowledge Graphs:A Roadmap

(后续更新完善)

2. KG-ENHANCED LLMS

2.1 KG-enhanced LLM Pre-training

以往将KGs集成到大型语言模型的工作主要分为三个部分:1)将KGs集成到训练目标中,2)将KGs集成到LLM输入中,3)将KGs集成到附加的融合模块中。

2.1.1 Integrating KGs into Training Objective

这一类的研究工作集中在设计新的知识感知训练目标,一个直观的想法是在预训练目标中暴露出更多的知识实体。

例如:

GLM利用知识图谱结构来分配一个掩盖概率。具体来说,可以在一定数量的跳数内到达的实体被认为是最重要的学习实体,在预训练期间,它们被赋予更高的屏蔽概率。

E-BERT进一步控制标记级和实体级训练损失之间的平衡。训练损失值被用作标记和实体的学习过程的指示,它动态地确定它们在下一个训练周期的比例。

SKEP采用了类似的融合方法,在LLMs预训练期间注入情感知识。SKEP首先通过利用PMI和一组预定义的种子情感词来确定具有积极和消极情感的词。然后,它在词语掩蔽目标中为这些确定的情感词语分配一个较高的掩蔽概率。

另一项工作是明确利用与知识和输入文本的联系。

如图9所示,ERNIE提出了一个新的词-实体对齐训练目标作为预训练目标。

具体来说,ERNIE将文本中提到的句子和相应的实体都输入到LLM中,然后训练LLM来预先决定文本标记和知识图谱中实体之间的对齐链接。

KALM通过纳入实体嵌入来增强输入的标记,除了纯标记的预训练目标外,还包括一个实体预测预训练任务。这种方法旨在提高LLM捕获与实体有关的知识的能力。

KEPLER直接将知识图谱嵌入训练目标和Masked token预训练目标纳入一个基于共享变压器的编码器。

确定性的LLM专注于预训练语言模型以捕获确定性的事实知识。它只对有确定性实体作为问题的跨度进行遮蔽,并引入了额外的线索对比学习和线索分类目标。

WKLM首先用其他同类型的实体替换文本中的实体,然后将其送入LLMs。该模型被进一步预训练以区分实体是否被替换。

相关推荐
失散132 小时前
自然语言处理——02 文本预处理(上)
人工智能·自然语言处理
nenchoumi31193 小时前
Tello无人机与LLM模型控制 ROS
人工智能·语言模型·机器人·无人机
什么都想学的阿超5 小时前
【大语言模型 00】导读
人工智能·语言模型·自然语言处理
是Yu欸5 小时前
【LLM1】大型语言模型的基本生成机制
自然语言处理
cwn_9 小时前
牛津大学xDeepMind 自然语言处理(1)
人工智能·深度学习·机器学习·自然语言处理
z千鑫10 小时前
【OpenAI】 GPT-4o-realtime-preview 多模态、实时交互模型介绍+API的使用教程!
人工智能·gpt·语言模型·aigc
lucky_lyovo17 小时前
自然语言处理NLP---预训练模型与 BERT
人工智能·自然语言处理·bert
小白杨树树1 天前
【LLM】文献阅读-ISOLATE GPT:基于大语言模型的执行隔离架构
人工智能·gpt·语言模型
七夜zippoe1 天前
如何使用 AI 大语言模型解决生活中的实际小事情?
人工智能·语言模型·生活
暮小暮1 天前
从ChatGPT到智能助手:Agent智能体如何颠覆AI应用
人工智能·深度学习·神经网络·ai·语言模型·chatgpt