Chain-Of-Note:解决噪声数据、不相关文档和域外场景来改进RAG的表现

CoN要点

CoN框架由三种不同的类型组成,研究称之为阅读笔记。

上面的图像,类型(A)显示了检索到的数据或文档回答查询的位置。LLM仅使用NLG从提供的数据中格式化答案。

类型(B)中,检索到的文档不直接回答查询,但是上下文洞察足以使LLM将检索到的文档与它自己的知识结合起来,从而推断出答案。

类型©是指检索到的文档是不相关的,LLM没有相关的知识来响应,导致框架没有给出错误或错误的答案。

CoN是一个自适应过程,或逻辑和推理层,其中直接信息与上下文推理和法学硕士知识识别相平衡。

数据的四个方面

为了使模型具有生成NoC阅读笔记的能力,需要进行微调。

论文训练了一个llama - 27b模型,将笔记能力整合到CON中。

CoN不仅是一个提示模板,而且还包含了一个经过微调的可以记笔记模型。因此CoN可以看作是RAG和Fine-Tuning的结合。

这又回到了数据人工智能的概念和数据的四个方面,即数据发现、数据设计、数据开发和数据交付。

一般来说,RAG和具体的CoN可以看作是数据交付过程的一部分。但是为了训练NoC模型,需要一个数据发现、数据设计和数据开发的过程。

对于这项研究,收集适当的训练数据至关重要。

每个阅读笔记的手动注释是资源密集型的,因此研究团队采用了最先进的语言模型来生成注释。

如果在企业环境中实施NoC,那么人工智能加速数据生产力工作室将是至关重要的。这种"人工"的过程对于具有清晰信号的相关训练数据非常重要。

CoN 模板

下面是LangSmith的CoN模板。给定一个问题,查询Wikipedia并使用带有Chain-of-Note提示的OpenAI的API提取答案。

对于标准RAG:

 Task Description: The primary objective is to briefly answer a specific 
 question.

对于带有CON的RALM:

 Task Description:
 
 1. Read the given question and five Wikipedia passages to gather relevant 
    information.
 2. Write reading notes summarizing the key points from these passages.
 3. Discuss the relevance of the given question and Wikipedia passages.
 4. If some passages are relevant to the given question, provide a brief 
    answer based on the passages. 
 5. If no passage is relevant, direcly 
    provide answer without considering the passages.

CoN的对于RAG的改善

RAG检索增强生成已经成为llm的重要推动者。最值得注意的是,随着RAG的引入,模型幻觉得到了很大程度的抑制,RAG也可以作为模型性能的均衡器。

RAG面临的挑战是确保在推理时向LLM提供准确、高度简洁和上下文相关的数据。

但是不相关数据的检索可能导致错误的响应,并可能导致模型忽略其固有的知识,即使它拥有足够的信息来处理查询。

所以CoN 作为一种新的方法,提高RAG的弹性。特别是在RAG数据不包含与查询上下文相关的明确信号的情况下。

该研究的下图更详细地说明了NoC的实现。该框架主要构建了三种类型的阅读笔记......

CoN框架为检索到的文档生成顺序的阅读注释,从而能够系统地评估从外部文档检索到的信息的相关性和准确性。

通过创建顺序阅读笔记,该模型不仅评估每个文档与查询的相关性,而且还确定这些文档中最关键和最可靠的信息片段。

这个过程有助于过滤掉不相关或不可信的内容,从而产生更准确和上下文相关的响应。

总结

基于llm的生成式人工智能实现的答案不是RAG或模型微调。而是两者的结合。因为上下文参考是非常重要的,从数据提取中的信号越清晰越好。经过微调的模型提供了额外的上下文,以及检索到的文档和NoC提示模板。数据与高效的数据发现和设计方法将变得越来越重要。

论文地址:

https://avoid.overfit.cn/post/1a108bbaf6c84b5fbc51554fefa222cd

相关推荐
千天夜4 分钟前
使用UDP协议传输视频流!(分片、缓存)
python·网络协议·udp·视频流
测试界的酸菜鱼7 分钟前
Python 大数据展示屏实例
大数据·开发语言·python
羊小猪~~11 分钟前
神经网络基础--什么是正向传播??什么是方向传播??
人工智能·pytorch·python·深度学习·神经网络·算法·机器学习
放飞自我的Coder41 分钟前
【python ROUGE BLEU jiaba.cut NLP常用的指标计算】
python·自然语言处理·bleu·rouge·jieba分词
正义的彬彬侠1 小时前
【scikit-learn 1.2版本后】sklearn.datasets中load_boston报错 使用 fetch_openml 函数来加载波士顿房价
python·机器学习·sklearn
资源补给站1 小时前
论文2—《基于柔顺控制的智能神经导航手术机器人系统设计》文献阅读分析报告
机器学习·机器人·手术机器人
张小生1801 小时前
PyCharm中 argparse 库 的使用方法
python·pycharm
秃头佛爷1 小时前
Python使用PDF相关组件案例详解
python
Dxy12393102161 小时前
python下载pdf
数据库·python·pdf
叶知安1 小时前
如何用pycharm连接sagemath?
ide·python·pycharm