GREASELM: GRAPH REASONING ENHANCED LANGUAGE MODELS FOR QUESTION ANSWERING

本文是LLM系列文章,针对《GREASELM: GRAPH REASONING ENHANCED

LANGUAGE MODELS FOR QUESTION ANSWERING》的翻译。

GREASELM:图推理增强的问答语言模型

  • 摘要
  • [1 引言](#1 引言)
  • [2 相关工作](#2 相关工作)
  • [3 提出的方法:GREASELM](#3 提出的方法:GREASELM)
  • [4 实验设置](#4 实验设置)
  • [5 实验结果](#5 实验结果)
  • [6 结论](#6 结论)

摘要

回答关于文本叙事的复杂问题需要对所陈述的上下文和作为其基础的世界知识进行推理。然而,作为大多数现代QA系统的基础的预训练语言模型(LM)并不能有力地表示概念之间的潜在关系,而这是推理所必需的。虽然知识图谱(KG)经常被用来用世界知识的结构化表示来扩充LMs,但如何有效地融合和推理KG表示和语言上下文仍然是一个悬而未决的问题,因为语言上下文提供了情境约束和细微差别。在这项工作中,我们提出了GREASELM,这是一种新的模型,它在多层模态交互操作上融合了来自预训练的LM和图神经网络的编码表示。来自两种模式的信息传播到另一种模式,允许语言上下文表示以结构化的世界知识为基础,并允许上下文中的语言细微差别(例如否定、对冲)告知知识的图形表示。我们在常识推理(即CommonsenseQA、OpenbookQA)和医学问答(即MedQA USMLE)领域的三个基准测试上的结果表明,GREASELM可以更可靠地回答需要对情境约束和结构化知识进行推理的问题,甚至优于8倍。

1 引言

2 相关工作

3 提出的方法:GREASELM

4 实验设置

5 实验结果

6 结论

在本文中,我们介绍了GREASELM,这是一种新的模型,通过语言模型和知识图谱中的知识之间的联合信息交换,实现交互式融合。实验结果表明,在来自多个领域(常识和医学)的标准数据集上,与先前的KG+LM和仅LM基线相比,性能优越。我们的分析表明,改进了能力建模问题,表现出文本的细微差别,如否定和对冲。

相关推荐
亚马逊云开发者14 分钟前
Agentic AI基础设施实践经验系列(七):可观测性在Agent应用的挑战与实践
人工智能
cwh_rs_giser15 分钟前
如何高效设置机器学习超参数?——借鉴成熟AutoML框架的实践
人工智能·python·机器学习
逻极18 分钟前
Scikit-learn 入门指南:从零到一掌握机器学习经典库(2025 最新版)
人工智能·python·机器学习·ai·scikit-learn·agent
草莓熊Lotso30 分钟前
C++ 抽象类与多态原理深度解析:从纯虚函数到虚表机制(附高频面试题)
java·运维·服务器·开发语言·c++·人工智能·笔记
XINVRY-FPGA31 分钟前
5CEFA9F23I7N Altera CycloneV E(Enhanced)FPGA
人工智能·嵌入式硬件·计算机视觉·fpga开发·硬件工程·dsp开发·fpga
Wayfreem36 分钟前
Spring AI Alibaba 学习之最简单的快速入门
人工智能·学习·spring
shayudiandian40 分钟前
图像分类深度学习
人工智能
王哈哈^_^1 小时前
【完整源码+数据集】车牌数据集,yolov8车牌检测数据集 7811 张,汽车车牌识别数据集,智慧交通汽车车牌识别系统实战教程
人工智能·深度学习·yolo·目标检测·计算机视觉·毕业设计·智慧城市
IT_陈寒1 小时前
JavaScript 性能优化实战:我从 V8 源码中学到的 7 个关键技巧
前端·人工智能·后端
大千AI助手1 小时前
决策树悲观错误剪枝(PEP)详解:原理、实现与应用
人工智能·算法·决策树·机器学习·剪枝·大千ai助手·悲观错误剪枝