AI学习_04_向量概念

前言

RAG流程中，向量库是一个重要的节点。

什么是向量？

概念：

向量（Vector）就是文本的 "数学身份证"：它把一段文字的语义信息 ，转换成一串固定长度的数字列表 ，让计算机能 "看懂" 文字的含义并做相似度计算。

简单来说，就是让计算机更方便的理解不同的文本内容，是否表述的是一个意思。

例如这两句话：

人类可能知道是一个意思，但是计算机却不知道

可以参考下图理解

通过文本嵌入模型 （如text-embedding-v1）通过深度学习等技术，从文本提取语义特征并映射为固定长度的数字序列。

具体原理这里不深究，因为会牵扯到深度学习。

只需要记得可以使用文本嵌入模型来实现即可

在向量匹配的过程中，如何识别2段文本是否表述相似的含义，主要可以通过如余弦相似度等算法来完成。

比如（下列案例中向量为示例，仅描述概念，非真实向量）：

通过余弦相似度算法可以计算得到：A和B相似度0.999789，A和C相似度0.361446，其中相似度越靠近1，相似度越高

由此可通过精确的数学计算，去匹配2段文本是否描述同一个意思，提高语义匹配的效率和精度。

如何更为精准的完成语义匹配，生成向量的维度是一个很重要的指标。

如text-embedding-v1模型，可以生成1536维的向量（一段文本固定得到1536个数字序列），比较实用。

选择合适的向量维度需要在精确和性能之间做平衡。

一般1536维算是比较好的选择。

这里有点抽象，后面还是需要再深入研究下

例如：一段文本是如何拆分成维度的，这个可能涉及到了模型底层了。。

向量（Vector）就是文本的 "数学身份证"

它把一段文字的语义信息，转换成一串固定长度的数字列表，让计算机能"看懂" 文字的含义并做相似度计算。