继续开始更新AI学习笔记——RAG技术

RAG技术:

1,读取文章,获得内容

2,分段成为chunks

3,向量化,形成向量数据库

4,用户问题,同样向量化

5,在向量库内部进行检索

6,检索获得有效文档,chunks,变成context

7,与问题和context形成prompt

8,将prompt给到大模型,进行输出

9,最后形成回答给到用户

RAG技术的卡点:

1,数据的读取,格式以及读取的问题

2,合理分段,分成chunk

3,如何合理embedding向量化

4,如何确保用户提出了有效问题,问题可能是无效,无价值的

5,检索有用的段落是否有效,正确

6,有效段落太多,是否排序,如何排序?

7,具体如何形成有效的prompt?格式如何?

8,使用什么大模型,通用的,还是开源微调的

9,如何给用户反馈,是否存在一个检查机制,不合格再重新生成?

数据量化与蒸馏:

简单来说,要减少数据的使用空间,压缩数据。那所有的数据如果精度很高,必然需要的资源就极大。

那如果统一使用一种精度,比如都使用浮点数16位,32比特的格式表示,那就统一数据表示形式,最后完成了数据空间的压缩。

蒸馏的意思是,原本使用大模型需要大量的资源以及相关数据,那使用一个小模型,不断调参,确保最后的输出结果与大模型相似,这样同样也压缩了数据空间。

另外还有一种,剪枝算法,也是一种压缩方式。

上述资料整理来自:up主:AI老兵文哲

相关推荐
凯子坚持 c几秒前
CANN 生态新星:`minddata-dataset-engine` 如何加速 AI 数据 pipeline
人工智能
Fairy要carry2 分钟前
面试-GRPO强化学习
开发语言·人工智能
xiaobaibai1534 分钟前
营销自动化终极形态:AdAgent 自主闭环工作流全解析
大数据·人工智能·自动化
自不量力的A同学10 分钟前
Solon AI v3.9 正式发布:全能 Skill 爆发
java·网络·人工智能
一枕眠秋雨>o<16 分钟前
从抽象到具象:TBE如何重构AI算子的编译哲学
人工智能
xiaobaibai15316 分钟前
决策引擎深度拆解:AdAgent 用 CoT+RL 实现营销自主化决策
大数据·人工智能
island131418 分钟前
CANN ops-nn 算子库深度解析:神经网络核心计算的硬件映射、Tiling 策略与算子融合机制
人工智能·深度学习·神经网络
冬奇Lab19 分钟前
一天一个开源项目(第14篇):CC Workflow Studio - 可视化AI工作流编辑器,让AI自动化更简单
人工智能·开源·编辑器
是小蟹呀^20 分钟前
从稀疏到自适应:人脸识别中稀疏表示的核心演进
人工智能·分类
云边有个稻草人21 分钟前
CANN ops-nn:筑牢AIGC的神经网络算子算力底座
人工智能·神经网络·aigc·cann