继续开始更新AI学习笔记——RAG技术

RAG技术:

1,读取文章,获得内容

2,分段成为chunks

3,向量化,形成向量数据库

4,用户问题,同样向量化

5,在向量库内部进行检索

6,检索获得有效文档,chunks,变成context

7,与问题和context形成prompt

8,将prompt给到大模型,进行输出

9,最后形成回答给到用户

RAG技术的卡点:

1,数据的读取,格式以及读取的问题

2,合理分段,分成chunk

3,如何合理embedding向量化

4,如何确保用户提出了有效问题,问题可能是无效,无价值的

5,检索有用的段落是否有效,正确

6,有效段落太多,是否排序,如何排序?

7,具体如何形成有效的prompt?格式如何?

8,使用什么大模型,通用的,还是开源微调的

9,如何给用户反馈,是否存在一个检查机制,不合格再重新生成?

数据量化与蒸馏:

简单来说,要减少数据的使用空间,压缩数据。那所有的数据如果精度很高,必然需要的资源就极大。

那如果统一使用一种精度,比如都使用浮点数16位,32比特的格式表示,那就统一数据表示形式,最后完成了数据空间的压缩。

蒸馏的意思是,原本使用大模型需要大量的资源以及相关数据,那使用一个小模型,不断调参,确保最后的输出结果与大模型相似,这样同样也压缩了数据空间。

另外还有一种,剪枝算法,也是一种压缩方式。

上述资料整理来自:up主:AI老兵文哲

相关推荐
彭思远20061 分钟前
从 0 到 1 搭建心脏病预测模型:一名大二学生的机器学习实践手记
人工智能·机器学习
HXDGCL2 分钟前
环形导轨精度标准解析:如何满足CATL产线±0.05mm要求?
人工智能·机器学习·性能优化·自动化·自动化生产线·环形导轨
AAD555888992 分钟前
金属丝缺陷检测与分类系统实战-基于reppoints的改进模型训练与优化_1
人工智能·分类·数据挖掘
熊猫钓鱼>_>4 分钟前
当想象力成为生产力,AI视频生成如何重塑2026年的创作世界
人工智能·ai·aigc·音视频·提示词·ai视频
装不满的克莱因瓶5 分钟前
Cursor超长会话跨窗口关联解决方案
人工智能·ai·agent·ai编程·cursor·智能体
deng-c-f9 分钟前
Linux C/C++ 学习日记(60):redis(一):基本介绍
学习
仙女修炼史16 分钟前
How transferable are features in deep neural networks
人工智能·深度学习·学习
摩尔元数21 分钟前
出入库管理智能升级,工厂管理更高效、透明
大数据·数据仓库·人工智能·制造
北京耐用通信23 分钟前
如何用耐达讯自动化Profibus总线光纤中继器解决变频器长距离通信干扰问题?
人工智能·物联网·网络协议·自动化·信息与通信
Elastic 中国社区官方博客23 分钟前
Elasticsearch:Jina Reranker v3
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jina