【大语言模型】ACL2024论文-26 在支持数据存在的情况下进行框架构建:以美国经济新闻为例研究

【大语言模型】ACL2024论文-26 在支持数据存在的情况下进行框架构建:以美国经济新闻为例研究


目录

文章目录


在支持数据存在的情况下进行框架构建:以美国经济新闻为例研究

https://arxiv.org/pdf/2402.14224

摘要

本文提出了一个计算框架,用于分析在存在支持数据的情况下的新闻编辑选择。研究聚焦于经济新闻,因为经济指标的报道提供了一个相对简单的方法来确定不同出版物的选择和框架。通过这些指标的值,我们可以了解经济的实际状况,以及出版物如何选择报道它。研究定义了框架预测作为一系列相互依赖的任务。在文章层面,我们学习识别对经济总体状况的报道立场。然后,对于文章中报告的每个数值量,我们学习识别它是否对应于经济指标,以及它是以积极还是消极的方式被报道。通过跟踪2015年至2023年间六家美国出版商的头条文章,我们进行了分析。

研究背景

主流媒体在选择报道内容和报道方式上有很大的自由度。这些选择对人们的认知和随后的行为有实际影响。然而,缺乏客观的衡量标准来评估编辑选择,使得这一领域的研究变得特别困难。本文认为,在一些具有新闻价值的主题中,客观的衡量标准确实存在,形式就是支持数据,并提出了一个计算框架来分析这种设置下的编辑选择。

问题与挑战

  1. 编辑选择的客观衡量:大多数选择和框架决策缺乏客观衡量标准。
  2. 经济新闻的框架分析:如何准确识别经济新闻中的主题是如何被呈现的。
  3. 数据驱动的新闻分析:如何利用大量的经济数据来理解和预测新闻报道的趋势。

如何解决

研究者提出了一个计算框架,通过定义框架预测为一系列相互依赖的任务来解决上述问题。在文章层面,识别对经济总体状况的报道立场;对于文章中报告的每个数值量,识别它是否对应于经济指标,以及它的报道极性。此外,研究者收集了2015年至2023年间六家美国主要新闻媒体的头条文章,并为这些文章提供了高质量的框架组成部分注释。

创新点

  1. 框架预测的分解:将经济框架分解为一系列相互依赖的任务,以更细致地捕捉框架的细微差别。
  2. 计算框架的应用:将计算框架应用于美国经济新闻,以自动识别文章如何被描绘,哪些指标被用来支持这种观点,以及这些指标是如何被呈现的。
  3. 低监督设置下的自动化方法:提出了在低监督设置下检测每个提出的框架组成部分的自动化方法。

算法模型

研究者采用了统计关系学习(SRL)方法,特别是概率软逻辑(PSL),来模拟框架预测的联合分布。通过定义文章层面和数量层面的先验概率,以及它们之间的依赖关系,模型能够利用有限的标注数据进行有效的预测。此外,研究者还利用预训练的语言模型(如RoBERTa)和领域自适应预训练(DAPT)来增强模型的先验概率。

实验效果

实验部分,研究者在5折交叉验证的基础上,对模型进行了评估。结果显示,领域自适应预训练(DAPT)对于数量层面的预测特别有帮助,但对文章层面的预测提升不大。关系模型在大多数情况下都能提升性能,尤其是在数量层面。此外,研究者还展示了如何使用框架来跟踪不同新闻媒体对特定经济指标的报道选择和框架变化。

推荐阅读指数:★★★★☆


后记

如果您对我的博客内容感兴趣,欢迎三连击 ( **点赞、收藏和关注 **)和留下您的评论,我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型,深度学习和计算机视觉相关方向)最新学术论文及工程实践方面的内容分享,助力您更快更准更系统地了解 AI前沿技术

相关推荐
铭keny20 分钟前
YOLO11 目标检测从安装到实战
人工智能·目标检测·目标跟踪
小牛头#5 小时前
clickhouse 各个引擎适用的场景
大数据·clickhouse·机器学习
杨小扩6 小时前
第4章:实战项目一 打造你的第一个AI知识库问答机器人 (RAG)
人工智能·机器人
whaosoft-1436 小时前
51c~目标检测~合集4
人工智能
雪兽软件6 小时前
2025 年网络安全与人工智能发展趋势
人工智能·安全·web安全
元宇宙时间7 小时前
全球发展币GDEV:从中国出发,走向全球的数字发展合作蓝图
大数据·人工智能·去中心化·区块链
小黄人20257 小时前
自动驾驶安全技术的演进与NVIDIA的创新实践
人工智能·安全·自动驾驶
ZStack开发者社区8 小时前
首批 | 云轴科技ZStack加入施耐德电气技术本地化创新生态
人工智能·科技·云计算
X Y O9 小时前
神经网络初步学习3——数据与损失
人工智能·神经网络·学习
kngines9 小时前
【力扣(LeetCode)】数据挖掘面试题0002:当面对实时数据流时您如何设计和实现机器学习模型?
机器学习·数据挖掘·面试题·实时数据