【大语言模型】ACL2024论文-26 在支持数据存在的情况下进行框架构建：以美国经济新闻为例研究

本文提出了一个计算框架，用于分析在存在支持数据的情况下的新闻编辑选择。研究聚焦于经济新闻，因为经济指标的报道提供了一个相对简单的方法来确定不同出版物的选择和框架。通过这些指标的值，我们可以了解经济的实际状况，以及出版物如何选择报道它。研究定义了框架预测作为一系列相互依赖的任务。在文章层面，我们学习识别对经济总体状况的报道立场。然后，对于文章中报告的每个数值量，我们学习识别它是否对应于经济指标，以及它是以积极还是消极的方式被报道。通过跟踪2015年至2023年间六家美国出版商的头条文章，我们进行了分析。

研究背景

主流媒体在选择报道内容和报道方式上有很大的自由度。这些选择对人们的认知和随后的行为有实际影响。然而，缺乏客观的衡量标准来评估编辑选择，使得这一领域的研究变得特别困难。本文认为，在一些具有新闻价值的主题中，客观的衡量标准确实存在，形式就是支持数据，并提出了一个计算框架来分析这种设置下的编辑选择。

问题与挑战

编辑选择的客观衡量：大多数选择和框架决策缺乏客观衡量标准。
经济新闻的框架分析：如何准确识别经济新闻中的主题是如何被呈现的。
数据驱动的新闻分析：如何利用大量的经济数据来理解和预测新闻报道的趋势。

如何解决

研究者提出了一个计算框架，通过定义框架预测为一系列相互依赖的任务来解决上述问题。在文章层面，识别对经济总体状况的报道立场；对于文章中报告的每个数值量，识别它是否对应于经济指标，以及它的报道极性。此外，研究者收集了2015年至2023年间六家美国主要新闻媒体的头条文章，并为这些文章提供了高质量的框架组成部分注释。

创新点

框架预测的分解：将经济框架分解为一系列相互依赖的任务，以更细致地捕捉框架的细微差别。
计算框架的应用：将计算框架应用于美国经济新闻，以自动识别文章如何被描绘，哪些指标被用来支持这种观点，以及这些指标是如何被呈现的。
低监督设置下的自动化方法：提出了在低监督设置下检测每个提出的框架组成部分的自动化方法。

算法模型

研究者采用了统计关系学习（SRL）方法，特别是概率软逻辑（PSL），来模拟框架预测的联合分布。通过定义文章层面和数量层面的先验概率，以及它们之间的依赖关系，模型能够利用有限的标注数据进行有效的预测。此外，研究者还利用预训练的语言模型（如RoBERTa）和领域自适应预训练（DAPT）来增强模型的先验概率。

实验效果

实验部分，研究者在5折交叉验证的基础上，对模型进行了评估。结果显示，领域自适应预训练（DAPT）对于数量层面的预测特别有帮助，但对文章层面的预测提升不大。关系模型在大多数情况下都能提升性能，尤其是在数量层面。此外，研究者还展示了如何使用框架来跟踪不同新闻媒体对特定经济指标的报道选择和框架变化。

推荐阅读指数：★★★★☆

后记

如果您对我的博客内容感兴趣，欢迎三连击 ( **点赞、收藏和关注 **）和留下您的评论，我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型，深度学习和计算机视觉相关方向)最新学术论文及工程实践方面的内容分享，助力您更快更准更系统地了解 AI前沿技术。

【大语言模型】ACL2024论文-26 在支持数据存在的情况下进行框架构建：以美国经济新闻为例研究