RAFT微调学习笔记

参考:https://zhuanlan.zhihu.com/p/688757352

1、什么是RAFT

2、与普通Fine-tuning的区别

3、训练数据样式

复制代码
Question: 公司2023年的净利润是多少?
Retrieved Docs: [文档段落1, 文档段落2, ...]
Answer: 公司2023年净利润为3.2亿元。

4、训练数据是如何构造的

1.1 对于一个pdf,先把pdf切分成chunk,也就是产生多个doc。

1.2 利用chatgpt4为每一个doc,生成多个query

1.3 根据query和doc,来生成相关的思维链式的答案

**1.4 除了增加相关的doc到训练的promt外,还随机从全量的doc中,**以一定的概率p进行下面的操作。

p:添加相关的doc到context来+4个随机的doc。

1-p:不添加相关的doc到context,只有4个随机的doc

相关推荐
vortex54 分钟前
深度字典攻击(实操笔记·红笔思考)
前端·chrome·笔记
闪闪发亮的小星星6 分钟前
主旋参数(四元数)与欧拉参数
笔记·其他
修己xj16 分钟前
一月存档,二月加载
学习
蒸蒸yyyyzwd31 分钟前
c网络编程学习笔记
c语言·网络·学习
驱动探索者39 分钟前
linux hwspinlock 学习
linux·运维·学习
近津薪荼39 分钟前
优选算法——滑动窗口1(单调性)
c++·学习·算法
齐鲁九零1 小时前
【AI推荐】推荐适合学英语的美剧
学习
蒸蒸yyyyzwd1 小时前
算法学习笔记
笔记·算法
山岚的运维笔记1 小时前
SQL Server笔记 -- 第13章:IF...ELSE
数据库·笔记·sql·microsoft·sqlserver
雾岛听蓝1 小时前
C++11新特性(可变参数模板、新的类功能、STL中的一些新变化)
开发语言·c++·经验分享·笔记