嵌入模型与Chroma向量数据库 - 嵌入模型与向量数据库简介 - AI大模型应用开发必备知识

大家好，我是小锋老师，最近更新《2027版 1天学会嵌入模型与Chroma向量数据库 AI大模型应用开发必备知识视频教程》专辑，感谢大家支持。

本课程主要介绍和讲解嵌入模型与向量数据库简介，Qwen3嵌入模型使用，Chroma向量数据库使用，Chroma安装，Client-Server模式，集合添加，修改，删除，查询操作以及自定义Embedding Functions。

提取码：1234

简单来说，嵌入（Embedding）是一种将非数字数据（如单词、句子、图像、甚至整个文档）转换为计算机能够理解的数字向量的技术。

这个向量不是随机生成的，它通过复杂的神经网络模型训练得出，能够捕获原始数据的语义信息。

嵌入模型最关键的特性是，它会把相似的语义内容映射到向量空间中的相近位置。

经过嵌入模型后，在向量空间中：

语义搜索：传统的搜索引擎依赖关键词匹配（比如搜索"苹果"只会返回包含"苹果"这两个字的结果）。而基于嵌入的搜索是语义上的理解和匹配，即使搜索"一种富含维生素的水果"，也能找到关于"苹果"的文档。
信息压缩与表示：将一个复杂的对象（图片、长文本）压缩成一个固定长度的、富含语义信息的向量。
作为大模型的"外部记忆"：这是最广泛的应用之一。大模型的知识是静态的（训练到某个时间点），且上下文窗口有限。通过嵌入，我们可以将海量的私有知识（公司文档、产品手册）向量化，然后在需要时检索出最相关的部分，再"喂"给大模型，让它基于这些知识回答问题，从而解决模型的知识局限和幻觉问题。

向量数据库是一种专门设计用来存储、索引和查询向量数据的数据库。

传统的关系型数据库擅长存储和查询结构化数据（如表格中的姓名、年龄），但它们无法高效处理向量的"相似性检索"需求。

向量数据库的核心能力是近似最近邻检索。

任务：给定一个查询向量，在数据库中快速找到与之最相似的K个向量。
算法：它不进行暴力的一一比对，而是使用专门的索引算法（如 HNSW------分层可导航小世界图，IVF------倒排文件索引）来极大地提高搜索效率。即便数据库中有十亿个向量，也能在毫秒级内返回结果。
距离度量：通常通过计算向量之间的"距离"来衡量相似度。
- 余弦相似度：衡量方向上的相似度（最常用）。
- 欧氏距离：衡量空间中的直线距离。
- 点积：衡量两个向量的投影。

高效的检索性能：专为大规模向量相似性搜索优化，这是传统数据库无法做到的。
元数据过滤：在实际应用中，向量通常还附带元数据。例如，一个商品图片的向量可能还附有"商品ID"、"价格"、"类别"等信息。向量数据库允许你在进行相似性搜索时，先或同时根据这些元数据进行过滤（例如，"找到与这件红色T恤最相似的衣服，且价格低于100元"）。
数据管理：提供增删改查、数据持久化、备份、容灾等标准的数据库功能。
与嵌入模型和大模型的完美集成：它们共同构成了现代AI应用（如RAG------检索增强生成）的数据流水线。

以下是5个最常用的向量数据库对比表格：

这是目前最经典的AI应用架构，可以清晰地看到嵌入模型和向量数据库是如何配合的。

场景：构建一个基于公司内部知识库的智能问答机器人。