Revisiting Large Language Models as Zero-shot Relation Extractors

本文是LLM系列文章,针对《Revisiting Large Language Models as Zero-shot Relation Extractors》的翻译。

修改大型语言模型作为零样本关系提取器

  • 摘要
  • [1 引言](#1 引言)
  • [2 相关工作](#2 相关工作)
  • [3 问题定义](#3 问题定义)
  • [4 提示设计](#4 提示设计)
  • [5 实验](#5 实验)
  • [6 结论](#6 结论)

摘要

即使在零样本设置下,关系提取(RE)也始终涉及一定程度的标记或未标记数据。最近的研究表明,只要给出自然语言提示,大型语言模型(LLM)就可以很好地转换到开箱即用的新任务中,这提供了在没有任何数据和参数调整的情况下从文本中提取关系的可能性。这项工作的重点是探索LLM,如ChatGPT,作为零样本关系提取器。一方面,我们分析了现有RE提示的缺点,并试图结合最近的提示技术,如思想链(CoT)来改进零样本RE。我们提出了总结和询问(SUMASK)提示,这是一种简单的提示,使用LLM递归地将RE输入转换为有效的问答(QA)格式。另一方面,我们在各种基准和设置上进行了全面的实验,以研究LLM在零样本RE上的能力。具体而言,我们有以下发现:(i)SUMASK在不同的模型大小、基准和设置下持续显著地提高了LLM的性能;(ii)与零样本和完全监督的方法相比,使用ChatGPT的零样本提示实现了具有竞争力或优越的结果;(iii)LLM在提取重叠关系方面提供了有希望的性能;(iv)不同关系的表现差异很大。与小型语言模型不同,LLM在处理挑战方面是有效的------没有上述(NoTA)关系。

1 引言

2 相关工作

3 问题定义

4 提示设计

5 实验

6 结论

这项工作对基于提示的LLM的零样本RE进行了全面的研究。除了VANILLA提示,我们还介绍了一种新颖的SUMASK提示,以充分探索LLM的力量。我们在六个基准上的实验证明了LLM在零样本RE中的能力。此外,我们能够回答上述三个问题。最近的提示技术(如CoT)显著改进了零样本RE提示。与最先进的关系分类模型相比,正确指导的LLM不仅提供了具有竞争力或优越的结果,而且对于零样本重叠RE也很有希望。

相关推荐
郑同学zxc7 小时前
机器学习18-tensorflow3
人工智能·机器学习
这张生成的图像能检测吗8 小时前
(论文速读)基于快速局域谱滤波的卷积神经网络
人工智能·神经网络·cnn·图神经网络·分类模型
wuxuand8 小时前
2026论文阅读——BayesAHDD:当贝叶斯决策规则遇上小样本单类分类
论文阅读·人工智能·分类·数据挖掘
wuxuand8 小时前
2026论文阅读——FedOCC:当单类分类遇上联邦学习——生成对抗+联邦蒸馏的新范式
人工智能·分类·数据挖掘
小陳参上10 小时前
用Python创建一个Discord聊天机器人
jvm·数据库·python
minstbe12 小时前
IC设计私有化AI助手实战:基于Docker+OpenCode+Ollama的数字前端综合增强方案(进阶版)
人工智能·python·语言模型·llama
GinoInterpreter13 小时前
什么是翻译的去中心化?
人工智能·自然语言处理·去中心化·区块链·机器翻译·机器翻译模型·机器翻译引擎
zyq99101_113 小时前
优化二分查找:前缀和降复杂度
数据结构·python·蓝桥杯
qyzm13 小时前
天梯赛练习(3月13日)
开发语言·数据结构·python·算法·贪心算法
码农小白AI14 小时前
IACheck AI报告文档审核:高端制造合规新助力,保障标准引用报告质量
大数据·人工智能·制造