vector向量数据库

为什么需要向量数据库?

主要依赖两点:

  • 通过特征提取,可以对自然世界的事物进行向量化的表达;
  • 海量向量数据的存储和查询,传统数据库力不从心,向量数据库应运而生。

向量数据库方向

当前主要有4个方向:

  • 基于Postgres、ClickHouse等进行魔改或者插件化实现的向量数据库,比如:pg vector等;
  • 基于传统倒排搜索添加稠密向量索引支持的向量数据库,比如:Lucene、ElasticSearch等;
  • 基于向量检索库实现的轻量级向量数据库,比如:基于Faiss的的Chroma等;
  • 基于原生向量设计的分布式向量云原生数据数据库,比如:milvus、qdrant。

一个成熟的向量数据应该具备的能力

主要有如下几个方面:

  • 数据持久化和低成本存储
  • 高性能查询
  • 数据分布与数据分区
  • 易于使用
  • 稳定可用
  • 可运维可观测
  • 智能化:和AI结合程度
  • 等等

ref

https://www.zhihu.com/question/603117242

https://zhuanlan.zhihu.com/p/628148081

相关推荐
行走的山峰40 分钟前
etcd三节点,其中一个坏掉了的恢复办法
数据库·etcd
ImomoTo4 小时前
HarmonyOS学习(十三)——数据管理(二) 关系型数据库
数据库·学习·harmonyos·arkts·鸿蒙
机器视觉知识推荐、就业指导6 小时前
Qt/C++事件过滤器与控件响应重写的使用、场景的不同
开发语言·数据库·c++·qt
jnrjian6 小时前
export rman 备份会占用buff/cache 导致内存压力
数据库·oracle
isNotNullX7 小时前
一文解读OLAP的工具和应用软件
大数据·数据库·etl
小诸葛的博客9 小时前
pg入门1——使用容器启动一个pg
数据库
大熊程序猿9 小时前
python 读取excel数据存储到mysql
数据库·python·mysql
落落落sss9 小时前
sharding-jdbc分库分表
android·java·开发语言·数据库·servlet·oracle
jnrjian9 小时前
Oracle 启动动态采样 自适应执行计划
数据库·oracle