嵌入模型与Chroma向量数据库 - Chroma安装与简单应用实例 - AI大模型应用开发必备知识

大家好,我是小锋老师,最近更新《2027版 1天学会 嵌入模型与Chroma向量数据库 AI大模型应用开发必备知识 视频教程》专辑,感谢大家支持。

本课程主要介绍和讲解嵌入模型与向量数据库简介,Qwen3嵌入模型使用,Chroma向量数据库使用,Chroma安装,Client-Server模式,集合添加,修改,删除,查询操作以及自定义Embedding Functions。

视频教程+课件+源码打包下载:

链接:https://pan.baidu.com/s/1Oo7dtFf_Zt7hJyl6aYX6TA?pwd=1234

提取码:1234

嵌入模型与Chroma向量数据库 - Chroma安装与简单应用实例 - AI大模型应用开发必备知识

我们看下Chroma的快速开始指南

可以学习下:

复制代码
​https://docs.trychroma.com/docs/overview/getting-started​

安装下ChromaDB

复制代码
pip install chromadb  -i http://mirrors.aliyun.com/pypi/simple/   --trusted-host mirrors.aliyun.com

创建ChromDB客户端,我们现在用的是默认的内存数据库模式。

复制代码
import chromadb
chroma_client = chromadb.Client()

创建集合,集合是用于存储嵌入、文档和任何其他元数据的地方。集合会对嵌入和文档进行索引,从而实现高效的检索和过滤。你可以使用以下名称创建一个集合:

复制代码
collection = chroma_client.create_collection(name="my_collection") # 创建集合

添加一些文档数据到集合里去,Chroma将自动存储您的文本,并处理嵌入和索引。您还可以自定义嵌入模型。您必须为文档提供唯一的字符串ID。

复制代码
collection.add(
    ids=["id1", "id2"],
    documents=[
        "This is a document about pineapple",
        "This is a document about oranges"
    ]
)

查询集合,您可以使用一系列查询文本对集合进行查询,Chroma将返回n个最相似的结果。就是这么简单!

复制代码
results = collection.query(
    query_texts=["This is a query document about hawaii"], # Chroma will embed this for you
    n_results=2 # how many results to return
)
print(results)

运行结果,默认chroma会自动安装一个all-MiniLM-L6-v2的嵌入模型。

复制代码
C:\Users\caofe\.cache\chroma\onnx_models\all-MiniLM-L6-v2\onnx.tar.gz: 100%|██████████| 79.3M/79.3M [07:15<00:00, 191kiB/s]
{'ids': [['id1', 'id2']], 'embeddings': None, 'documents': [['This is a document about pineapple', 'This is a document about oranges']], 'uris': None, 'included': ['metadatas', 'documents', 'distances'], 'data': None, 'metadatas': [[None, None]], 'distances': [[1.0404009819030762, 1.2430799007415771]]}
相关推荐
Elastic 中国社区官方博客20 小时前
使用 Azure SRE Agent 和 Elasticsearch 提升 SRE 生产力
大数据·人工智能·elasticsearch·microsoft·搜索引擎·云原生·azure
發糞塗牆20 小时前
【Azure 架构师学习笔记 】- Azure AI(19) - Agent升级增强
人工智能·ai·azure
luoganttcc1 天前
自动驾驶 世界模型 有哪些(二)
人工智能·机器学习·自动驾驶
人工智能AI技术1 天前
315曝光AI投毒!用C#构建GEO污染检测与数据安全防护方案
人工智能·c#
Hamm1 天前
不想花一分钱玩 OpenClaw?来,一起折腾这个!
javascript·人工智能·agent
_李小白1 天前
【AI大模型学习笔记之平台篇】第二篇:Gemini
人工智能·音视频
一点一木1 天前
🚀 2026 年 2 月 GitHub 十大热门项目排行榜 🔥
人工智能·github
理性的曜1 天前
VoloData——基于LangChain的智能数据分析系统
人工智能·vscode·数据分析·npm·reactjs·fastapi·ai应用
flying_13141 天前
图神经网络分享系列-MPNN(Neural Message Passing for Quantum Chemistry)(二)
人工智能·深度学习·神经网络·图神经网络·消息传递·门控机制·mpnn
HyperAI超神经1 天前
AI驱动量子精修,卡内基梅隆大学等提出AQuaRef,首次用量子力学约束精修蛋白质全原子模型
人工智能·深度学习·机器学习·架构·机器人·cpu·量子计算