3.milvus索引-HNSW

索引作用

加速大型数据集上的查询。

向量字段,仅只能创建一个索引。

milvus支持的向量索引类型大部分使用 近似最近邻搜索算法。ANNS该算法的核心不局限于返回最准确的结果,而是仅搜索目标的邻居。ANNS通过在可接受的范围内牺牲准确性提高检索效率。

比方,有一百条数据,其中有90条数据是满足条件的,使用ANNS可能只会返回89条数据。如果想准确返回90条数据,就需要采用暴力搜索。

milvus索引分类

内存索引,因为是在内存中所以加载速度更快。

磁盘索引

根据实现方式分类,ANNS向量索引可以分为4类:

1.基于树的索引,比如mysql中的索引是基于B+树。

2.基于图的索引

3.基于哈希的索引

4.基于量化的索引

根据数据类型,支持两种类型的索引:

  • floating-point embeddings 浮点类型,常用的索引

SCANN、IVF_FLAT、IVF_PQ、IVF_SQ8、FLAT、HNSW(效率比较高的索引算法)、ANNOY、AUTOINDEX、DISKANN

  • binary embeddings

BIN_FLAT、BIN_IVF_FLAT

**注意:**删掉索引前,需要现将Collection从内存中release卸载释放掉。

使用attu图形化工具,创建一个HNSW类型的索引

使用代码创建一个HNSW类型的索引

python 复制代码
from pymilvus import (
    connections,
    Collection,
)

collection_name = "first_milvus"
host = "192.168.171.130"
port = 19530
username = ""
password = ""

connections.connect("default", host=host, port=port, user=username, password=password)
coll = Collection(collection_name, consistency_level="Bounded", shards_num=1)

index_params = {
    "index_type": "HNSW",
    "metric_type": "L2",
    "params": {
        "M": 16,
        "efConstruction": 60
    }
}
coll.create_index(
  field_name="embeddings",
  index_params=index_params,
  index_name="idx_em"
)
print("done")
相关推荐
uncle_ll9 小时前
Milvus介绍及多模态检索实践:从部署到实战全解析
milvus·多模态·向量数据库·ann·rag·搜索·检索
失忆爆表症18 小时前
01_项目搭建指南:从零开始的 Windows 开发环境配置
windows·postgresql·fastapi·milvus
ASS-ASH2 天前
AI时代之向量数据库概览
数据库·人工智能·python·llm·embedding·向量数据库·vlm
dblens 数据库管理和开发工具3 天前
开源向量数据库比较:Chroma, Milvus, Faiss,Weaviate
数据库·开源·milvus·faiss·chroma·weaviate
玄同7654 天前
数据库全解析:从关系型到向量数据库,LLM 开发中的选型指南
数据库·人工智能·知识图谱·milvus·知识库·向量数据库·rag
无名修道院4 天前
AI大模型应用开发-RAG 基础:向量数据库(FAISS/Milvus)、文本拆分、相似性搜索(“让模型查资料再回答”)
人工智能·向量数据库·rag·ai大模型应用开发
自可乐4 天前
Milvus向量数据库/RAG基础设施学习教程
数据库·人工智能·python·milvus
dzj20215 天前
Unity中使用LLMUnity遇到的问题(五)——主要脚本的继承关系+用DuckDB对知识库升级的思考
unity·向量数据库·向量搜索·duckdb·llmunity
玄同7657 天前
LangChain v1.0+ Retrieval模块完全指南:从文档加载到RAG实战
人工智能·langchain·知识图谱·embedding·知识库·向量数据库·rag
猿小羽7 天前
AI 学习与实战系列:RAG 入门与实践全指南
ai·向量数据库·rag·ai实战·知识检索·retrievalaugmentedgeneration