向量数据库的使用

向量数据库

向量数据库是一种专门用于存储、管理和查询高维向量数据的数据库系统。随着人工智能和机器学习的广泛应用,向量数据库在处理非结构化数据(如文本、图像、音频和视频等)的任务中变得越来越重要。本文将介绍快速使用Chroma

安装

安装chromadb向量数据库

pip install chromadb 

创建链接

创建客户端

import chromadb
chroma_client = chromadb.Client()

创建集合

Chroma数据结构,包括集合、文档和Embedding。

collection = chroma_client.create_collection(name="my_collection")

添加文档

添加文档到集合中

collection.add(
    documents=[
        "This is a document about pineapple",
        "This is a document about oranges"
    ],
    ids=["id1", "id2"]
)

搜索

搜索文档并指定返回文档数

results = collection.query(
    query_texts=["This is a query document about hawaii"], # Chroma will embed this for you
    n_results=2 # how many results to return
)
print(results)

查看结果

可以看到夏威夷和菠萝更相似。

{
  'documents': [[
      'This is a document about pineapple',
      'This is a document about oranges'
  ]],
  'ids': [['id1', 'id2']],
  'distances': [[1.0404009819030762, 1.243080496788025]],
  'uris': None,
  'data': None,
  'metadatas': [[None, None]],
  'embeddings': None,
}

总结

向量数据库是 RAG 中的重要组件之一,文档索引会存储在向量数据库中,随着大模型的流行,感觉向量数据库也会持续发展,进一步提高性能。

相关推荐
讲文明的喜羊羊拒绝pua6 天前
AIGC学习笔记(2)——AI大模型开发工程师
llm·aigc·transformer·向量数据库·ai大模型开发
陌北v110 天前
Milvus 与 Faiss:选择合适的向量数据库
milvus·faiss·向量数据库
桦仔11 天前
老司机带你聊聊向量数据库
向量数据库·关系型数据库·向量数据库解释
dept12318 天前
python,pycharm,pytorch,向量数据库,环境搭建记录
pytorch·python·pycharm·向量数据库
python_知世21 天前
知识图谱融入向量数据库,带来RAG效果飞升
数据库·人工智能·llm·知识图谱·大语言模型·向量数据库·rag
Linux猿1 个月前
828华为云征文 | 云服务器Flexus X实例:向量数据库 pgvector 部署,实现向量检索
华为云·向量数据库·云服务器·pgvector·华为云服务器·云服务器flexus x实例
AskHarries1 个月前
Spring Boot集成Redis向量数据库实现相似性搜索
java·数据库·spring boot·redis·后端·向量数据库
OpenPie|拓数派2 个月前
基于云原生向量数据库 PieCloudVector 的 RAG 实践
云原生·向量数据库·pieclouddb·openpie·piecloudvector
虹科网络安全2 个月前
艾体宝洞察丨透过语义缓存,实现更快、更智能的LLM应用程序
redis·llm·大语言模型·向量数据库·语义缓存
OpenPie|拓数派2 个月前
云原生向量数据库 PieCloudVector 助力多模态大模型 AI 应用
云原生·大模型·向量数据库·pieclouddb·openpie·piecloudvector