大模型智能体在金融公告理解领域的应用 | OPENAIGC开发者大赛高校组AI创新之星奖

在第二届拯救者杯OPENAIGC开发者大赛中,涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到,我们特意开设了优秀作品报道专栏,旨在展示其独特之处和开发者的精彩故事。

无论您是技术专家还是爱好者,希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能,见证科技与创意的完美融合!

创未来AI应用赛-高校组AI创新之星奖

**作品名称:**大模型智能体在金融公告理解领域的应用

**参赛团队:**上海大学AI rookie

作品简介

基于通义千问大模型,针对准确理解公告内容的下游任务进行训练和部署。使得模型能够为信息检索、风险监控、市场分析等领域提供重要的支持和价值。

项目背景

主要解决通用大模型在专业领域知识不足、回答准确度低的问题。

以Qwen大语言模型为基础,通过自定义数据集和模型微调技术,强化模型在金融领域的专业性和准确性。针对不同的用户群体和需求,选用不同的技术路线以提高模型在金融领域的实际应用效果。使用公告评测集对模型进行对比评价,确保模型性能的显著提升。

核心技术和创新点

自定义数据集:使用GPT-4针对收集的无标签公告数据进行分类并生成训练数据,辅助大模型微调。

指令精调:参考不同应用场景、实际任务的需要精心设计提示词,使用指令精调的方式对Qwen大模型进行微调。

多种技术方案集成:根据不同用户的需求,提供三种不同的应用方案Agent方案、RAG方案以及微调大模型方案。

技术成果和突破

使用多维的答题路径,将公告内容成功转化为可操作的业务流程模型。

金融公告的四类细致分化有助于模型理解不同类型公告的内容和语境,节省TOKEN使用,每次任务计算资源减少63%。

通过LangChain框架,利用知识库定位,减少幻觉和噪声,事实错误率降低12%。

对模型的精调使得数据查询和开放性问题回答能力都有相应的增强,达到了41.76%的准确率提升。

未来发展

未来将引入更多的市场和行业数据,持续优化InternLM和LangChain框架和算法,对公告类型进行进一步的细分,并搭建相应的知识库来提高速度与准确性。

相关推荐
泰迪智能科技011 小时前
高校深度学习视觉应用平台产品介绍
人工智能·深度学习
盛派网络小助手2 小时前
微信 SDK 更新 Sample,NCF 文档和模板更新,更多更新日志,欢迎解锁
开发语言·人工智能·后端·架构·c#
Eric.Lee20212 小时前
Paddle OCR 中英文检测识别 - python 实现
人工智能·opencv·计算机视觉·ocr检测
cd_farsight2 小时前
nlp初学者怎么入门?需要学习哪些?
人工智能·自然语言处理
AI明说2 小时前
评估大语言模型在药物基因组学问答任务中的表现:PGxQA
人工智能·语言模型·自然语言处理·数智药师·数智药学
Focus_Liu2 小时前
NLP-UIE(Universal Information Extraction)
人工智能·自然语言处理
PowerBI学谦3 小时前
使用copilot轻松将电子邮件转为高效会议
人工智能·copilot
audyxiao0013 小时前
AI一周重要会议和活动概览
人工智能·计算机视觉·数据挖掘·多模态
Jeremy_lf3 小时前
【生成模型之三】ControlNet & Latent Diffusion Models论文详解
人工智能·深度学习·stable diffusion·aigc·扩散模型