Data-Centric Financial Large Language Models

本文是LLM系列文章,针对《Data-Centric Financial Large Language Models》的翻译。

以数据为中心的大语言金融模型

  • 摘要
  • [1 引言](#1 引言)
  • [2 背景](#2 背景)
  • [3 方法](#3 方法)
  • [4 实验](#4 实验)
  • [5 结论和未来工作](#5 结论和未来工作)

摘要

大型语言模型(LLM)有望用于自然语言任务,但在直接应用于金融等复杂领域时却举步维艰。LLM很难对所有相关信息进行推理和整合。我们提出了一种以数据为中心的方法,使LLM能够更好地处理财务任务。我们的关键见解是,与其一次用所有内容重载LLM,不如对数据进行预处理和预理解。我们使用基于多任务提示的微调创建了一个财务LLM(FLLM),以实现数据预处理和预理解。然而,每个任务的标记数据很少。为了克服手动注释成本,我们使用溯因增强推理(AAR)通过修改FLLM自己输出的伪标签来自动生成训练数据。实验表明,我们的以数据为中心的带有AAR的FLLM大大优于为原始文本设计的基线财务LLM,在财务分析和解释任务方面达到了最先进的水平。我们还开源了一个新的财务分析和解释基准。我们的方法为释放LLM在复杂现实世界领域的潜力提供了一条很有前途的途径。

1 引言

2 背景

3 方法

4 实验

5 结论和未来工作

本文提出了一种基于FLLM的以数据为中心的方法,以提高LLM在财务分析任务中的能力。为了克服标记数据的稀缺性,他们采用溯因增强推理来自动生成训练数据。实验表明,他们以数据为中心的金融LLM和溯因增强推理大大优于基线LLM,实现了最先进的金融分析和解释基准。以数据为中心的方法为释放LLM在复杂现实世界领域的潜力提供了一个很有前途的方向。采用新的财务分析和解释基准也是一项宝贵的贡献。此外,未来工作的一个有趣方向是将以数据为中心的方法与其他方法相结合,如金融文本的提示和自我监督预训练。整合财务报告、财报电话和股价等多模式数据也可以实现更细致的财务分析。

相关推荐
沫儿笙2 分钟前
柯马弧焊机器人气流智能调节
人工智能·物联网·机器人
love530love4 分钟前
【SD WebUI踩坑】启动报错 Expecting value: line 1 column 1 (char 0) 的终极解决方案
人工智能·windows·python·github·stablediffusion
木棉知行者4 分钟前
【第5篇】InceptionNeXT(CVPR2024):融合 Inception 思想与现代 CNN 设计的高效特征提取架构
人工智能·深度学习·计算机视觉·cnn
技术支持者python,php6 分钟前
训练分类识别器
人工智能·分类·数据挖掘
DX_水位流量监测7 分钟前
管网液位计的技术特性与工程应用解析
大数据·网络·人工智能·信息可视化·架构
paperxie_xiexuo7 分钟前
从数据到话语:面向期刊知识转化的智能写作协同机制研究
大数据·人工智能·ai写作·期刊论文
昇腾知识体系13 分钟前
vLLM-Ascend双机混部DeepSeek-R1-671B-0528 W8A8量化模型
人工智能
weixin1997010801614 分钟前
新京报 item_get - 获取详情数据接口对接全攻略:从入门到精通
大数据·人工智能
老贾专利烩14 分钟前
听力障碍市场规模扩容驱动因素:人口老龄化与技术进步量化分析
人工智能
大千AI助手14 分钟前
曼哈顿距离:概念、起源与应用全解析
人工智能·机器学习·数据挖掘·距离度量·曼哈顿距离·大千ai助手·街区距离