vector向量数据库

为什么需要向量数据库?

主要依赖两点:

  • 通过特征提取,可以对自然世界的事物进行向量化的表达;
  • 海量向量数据的存储和查询,传统数据库力不从心,向量数据库应运而生。

向量数据库方向

当前主要有4个方向:

  • 基于Postgres、ClickHouse等进行魔改或者插件化实现的向量数据库,比如:pg vector等;
  • 基于传统倒排搜索添加稠密向量索引支持的向量数据库,比如:Lucene、ElasticSearch等;
  • 基于向量检索库实现的轻量级向量数据库,比如:基于Faiss的的Chroma等;
  • 基于原生向量设计的分布式向量云原生数据数据库,比如:milvus、qdrant。

一个成熟的向量数据应该具备的能力

主要有如下几个方面:

  • 数据持久化和低成本存储
  • 高性能查询
  • 数据分布与数据分区
  • 易于使用
  • 稳定可用
  • 可运维可观测
  • 智能化:和AI结合程度
  • 等等

ref

https://www.zhihu.com/question/603117242

https://zhuanlan.zhihu.com/p/628148081

相关推荐
web安全工具库26 分钟前
告别刀耕火种:用 Makefile 自动化 C 语言项目编译
linux·运维·c语言·开发语言·数据库·算法·自动化
disanleya39 分钟前
怎样安全地开启MySQL远程管理权限?
数据库·mysql
【非典型Coder】1 小时前
Statement和PreparedStatement区别
数据库
m0_736927042 小时前
想抓PostgreSQL里的慢SQL?pg_stat_statements基础黑匣子和pg_stat_monitor时间窗,谁能帮你更准揪出性能小偷?
java·数据库·sql·postgresql
lang201509282 小时前
MySQL 8.0.29 及以上版本中 SSL/TLS 会话复用(Session Reuse)
数据库·mysql
望获linux3 小时前
【实时Linux实战系列】使用 u-trace 或 a-trace 进行用户态应用剖析
java·linux·前端·网络·数据库·elasticsearch·操作系统
清和与九4 小时前
binLog、redoLog和undoLog的区别
数据库·oracle
望获linux4 小时前
【实时Linux实战系列】FPGA 与实时 Linux 的协同设计
大数据·linux·服务器·网络·数据库·fpga开发·操作系统
总有刁民想爱朕ha4 小时前
Python自动化从入门到实战(24)如何高效的备份mysql数据库,数据备份datadir目录直接复制可行吗?一篇给小白的完全指南
数据库·python·自动化·mysql数据库备份
朝九晚五ฺ4 小时前
【Redis学习】持久化机制(RDB/AOF)
数据库·redis·学习