为什么需要向量数据库?
主要依赖两点:
- 通过特征提取,可以对自然世界的事物进行向量化的表达;
- 海量向量数据的存储和查询,传统数据库力不从心,向量数据库应运而生。
向量数据库方向
当前主要有4个方向:
- 基于Postgres、ClickHouse等进行魔改或者插件化实现的向量数据库,比如:pg vector等;
- 基于传统倒排搜索添加稠密向量索引支持的向量数据库,比如:Lucene、ElasticSearch等;
- 基于向量检索库实现的轻量级向量数据库,比如:基于Faiss的的Chroma等;
- 基于原生向量设计的分布式向量云原生数据数据库,比如:milvus、qdrant。
一个成熟的向量数据应该具备的能力
主要有如下几个方面:
- 数据持久化和低成本存储
- 高性能查询
- 数据分布与数据分区
- 易于使用
- 稳定可用
- 可运维可观测
- 智能化:和AI结合程度
- 等等