继续开始更新AI学习笔记——RAG技术

RAG技术:

1,读取文章,获得内容

2,分段成为chunks

3,向量化,形成向量数据库

4,用户问题,同样向量化

5,在向量库内部进行检索

6,检索获得有效文档,chunks,变成context

7,与问题和context形成prompt

8,将prompt给到大模型,进行输出

9,最后形成回答给到用户

RAG技术的卡点:

1,数据的读取,格式以及读取的问题

2,合理分段,分成chunk

3,如何合理embedding向量化

4,如何确保用户提出了有效问题,问题可能是无效,无价值的

5,检索有用的段落是否有效,正确

6,有效段落太多,是否排序,如何排序?

7,具体如何形成有效的prompt?格式如何?

8,使用什么大模型,通用的,还是开源微调的

9,如何给用户反馈,是否存在一个检查机制,不合格再重新生成?

数据量化与蒸馏:

简单来说,要减少数据的使用空间,压缩数据。那所有的数据如果精度很高,必然需要的资源就极大。

那如果统一使用一种精度,比如都使用浮点数16位,32比特的格式表示,那就统一数据表示形式,最后完成了数据空间的压缩。

蒸馏的意思是,原本使用大模型需要大量的资源以及相关数据,那使用一个小模型,不断调参,确保最后的输出结果与大模型相似,这样同样也压缩了数据空间。

另外还有一种,剪枝算法,也是一种压缩方式。

上述资料整理来自:up主:AI老兵文哲

相关推荐
九年义务漏网鲨鱼8 分钟前
【大模型学习 | MINIGPT-4原理】
人工智能·深度学习·学习·语言模型·多模态
jz_ddk21 分钟前
[学习] C语言数学库函数背后的故事:`double erf(double x)`
c语言·开发语言·学习
元宇宙时间24 分钟前
Playfun即将开启大型Web3线上活动,打造沉浸式GameFi体验生态
人工智能·去中心化·区块链
开发者工具分享26 分钟前
文本音频违规识别工具排行榜(12选)
人工智能·音视频
产品经理独孤虾1 小时前
人工智能大模型如何助力电商产品经理打造高效的商品工业属性画像
人工智能·机器学习·ai·大模型·产品经理·商品画像·商品工业属性
老任与码1 小时前
Spring AI Alibaba(1)——基本使用
java·人工智能·后端·springaialibaba
kfepiza1 小时前
Debian的`/etc/network/interfaces`的`allow-hotplug`和`auto`对比讲解 笔记250704
linux·服务器·网络·笔记·debian
蹦蹦跳跳真可爱5891 小时前
Python----OpenCV(图像増强——高通滤波(索贝尔算子、沙尔算子、拉普拉斯算子),图像浮雕与特效处理)
人工智能·python·opencv·计算机视觉
雷羿 LexChien1 小时前
从 Prompt 管理到人格稳定:探索 Cursor AI 编辑器如何赋能 Prompt 工程与人格风格设计(上)
人工智能·python·llm·编辑器·prompt
爱莉希雅&&&2 小时前
技术面试题,HR面试题
开发语言·学习·面试