Relation Extraction as Open-book Examination: Retrieval-enhanced Prompt Tuning

本文是LLM系列文章,针对《Relation Extraction as Open-book Examination:

Retrieval

关系提取作为开卷测试:检索增强提示调整

  • 摘要
  • [1 引言](#1 引言)
  • [2 方法](#2 方法)
  • [3 实验](#3 实验)
  • [4 相关工作](#4 相关工作)
  • [5 结论](#5 结论)

摘要

经过预训练的语言模型通过表现出显著的小样本学习能力,对关系提取做出了重大贡献。然而,用于关系提取的提示调优方法可能仍然无法推广到那些罕见或困难的模式。注意,以前的参数学习范式可以被视为将训练数据视为一本书的记忆,将推理视为闭书测试。在给定小样本实例的情况下,这些长尾或硬模式很难被记忆在参数中。为此,我们将RE视为一种开卷考试,并提出了一种新的半参数检索范式------增强关系提取的提示调整。我们构建了一个开放式书籍数据存储,用于检索基于提示的实例表示和作为存储键值对的对应关系标签。在推断过程中,该模型可以通过线性插值PLM的基本输出与数据存储上的非参数最近邻分布来推断关系。通过这种方式,我们的模型不仅通过训练期间存储在权重中的知识推断关系,而且通过展开和查询开卷数据存储中的示例来帮助决策。在基准数据集上进行的大量实验表明,我们的方法可以在标准监督和小样本设置中达到最先进的水平。

1 引言

2 方法

3 实验

4 相关工作

5 结论

在这项工作中,我们将RE视为一种开卷考试,并提出了检索增强的提示调优,这是一种新的RE范式,允许PLM引用开卷数据存储中的类似实例。RetrievalRE的成功表明,基于作为参考的提示调优来检索相关上下文,使PLM更容易预测长尾或硬模式。我们将考虑在未来的工作中使用更具体的功能来丰富开卷数据存储的组成。

相关推荐
飞睿科技几秒前
乐鑫信息推出ESP-Claw AI智能体框架,物联网进入“聊天造物”时代
人工智能·物联网·esp32·乐鑫科技·ai智能体
顾城猿1 小时前
NLP入门
人工智能·自然语言处理
zhangfeng11331 小时前
多台服务器同时训练llamfactory 大语言模型 国家超算中心 Slurm 是目前全球最主流的开源、高性能计算(HPC)集群资源管理与作业调度系统
服务器·语言模型·开源
独隅1 小时前
将MAE模型从PyTorch无缝迁移到TensorFlow Lite的完整实践指南
人工智能·pytorch·tensorflow
HackTorjan1 小时前
AI图像处理的核心原理:深度学习驱动的视觉特征提取与重构
图像处理·人工智能·深度学习·django·sqlite
梦梦代码精2 小时前
从工程视角拆解 BuildingAI:一个企业级开源智能体平台的架构设计与实现
人工智能·gitee·开源·github
supericeice2 小时前
复杂项目管理如何用好大模型:RAG、知识图谱与AI编排的落地框架
人工智能·知识图谱
AI机器学习算法7 小时前
深度学习模型演进:6个里程碑式CNN架构
人工智能·深度学习·cnn·大模型·ai学习路线
Ztopcloud极拓云视角8 小时前
从 OpenRouter 数据看中美 AI 调用量反转:统计口径、模型路由与多云应对方案
人工智能·阿里云·大模型·token·中美ai
AI医影跨模态组学8 小时前
如何将深度学习MTSR与膀胱癌ITGB8/TGF-β/WNT机制建立关联,并进一步解释其与患者预后及肿瘤侵袭、免疫抑制的生物学联系
人工智能·深度学习·论文·医学影像