RAG学习笔记

向量数据库

它是专门把文本、图像、音频等非结构化数据转成高维向量后,再进行"语义级"存储、检索与管理的专用数据库。

以「向量」为第一等公民的数据库系统,支持相似度计算(余弦、点积、欧氏距离)和高维索引(HNSW、IVF、PQ )等。

索引结构

HNSW(分层可导航小世界)

把所有向量构建成一个"多层图",搜索时像"导航一样跳来跳去"

其中,每个向量是一个节点,节点之间连"相似边",此图中上层是稀疏图(快速定位),下层是密集图(精细搜索)

搜索流程:从最高层开始,每次走到"更相似的点";一层一层往下,最后找到最近邻。

优点:查询速度快,精度高,工业界常用

缺点:内存占用大,构建索引慢

IVF(倒排索引)

先把数据"分桶",只在相关桶里查。

类似于聚类的流程:

1、用k-means把向量分成N个簇。

2、每个簇就是一个"桶"。

3、查询时,找最近的几个簇,只在这些簇里搜索。

优点:比暴力搜索快,可扩展性强。

缺点:可能漏掉最近邻,精度略低于HNSW

PQ(乘积量化)

核心思想:把向量"压缩编码",用查表代替距离计算。当需要查询时,预先算好距离表,直接查表(速度快)

优点:极大节省内存;适合超大规模(亿级)

缺点:有精度损失,需要训练codebook

Disk ANN(基于磁盘的神经网络)

核心思想:把索引放在磁盘上,同时还能做到接近内存及速度。

相较于HNSW,DISKANN部分在内存,大部分在磁盘。

优点:支持超大规模(10亿+),内存占用极低,性能接近HNSW。

缺点:实现复杂,强依赖磁盘性能(SSD)

常见组合

1、IVF+PQ(最经典):先分桶,再压缩

2、HNSW+PQ:图结构+压缩

3、DiskANN:HNSW+磁盘优化

向量检索

核心概念:给定一个「查询向量」,在庞大的向量集合里毫秒级找出与其最相似的 Top-K 个向量,并返回对应原始对象(文本、图片、商品等)的过程。

应用场景

1、RAG:把用户问题向量与知识库向量匹配,召回最相关段落。

2、推荐:用用户行为找相似商品/视频

3、以图搜图,异常检测等。

相关推荐
做cv的小昊13 小时前
【TJU】应用统计学——第五周作业(3.1 假设检验的基本思想、3.2 单个正态总体参数的假设检验)
学习·线性代数·机器学习·数学建模·矩阵·概率论·tju
格鸰爱童话14 小时前
向AI学习项目技能(六)
java·人工智能·spring boot·python·学习
H_老邪14 小时前
spring boot 学习之路-1.0
spring boot·后端·学习
东京老树根14 小时前
SAP学习笔记 - BTP SAP Build02 - Deploy,开始URL,Approve,Reject,履历确认,Log,Context
笔记·学习
zjeweler14 小时前
“网安+护网”终极300多问题面试笔记-全
笔记·网络安全·面试·职场和发展
仲芒14 小时前
[24年单独笔记] MySQL 常用的 DDL 命令
笔记·mysql·oracle
头疼的程序员15 小时前
计算机网络:自顶向下方法(第七版)第九章 学习分享(一)
学习·计算机网络
小墨同学boy15 小时前
越用越强不是广告语:拆解 Hermes Agent 的三层学习机制
人工智能·学习
仲芒16 小时前
[24年单独笔记] MySQL 常用的 DML 命令
数据库·笔记·mysql
lwewan16 小时前
CPU 调度
笔记·考研