基于内存的向量相似度计算,是否可以用PostgreSQL + pgvector进行平替

可以平替,而且是更"工程化"的做法,但取决于你要不要这几个能力:

  • 你现在(内存索引)优点:实现简单、依赖少、延迟低;缺点是重启就丢、多进程/多实例各算各的。
  • pgvector 优点:向量可持久化、多实例共享、可做权限/审计/备份、可用索引(HNSW/IVFFlat)提升检索速度;缺点是多一个数据库依赖、写入/迁移要做、延迟通常略高。

内存方案是最小成本最佳起步;但如果你后面要扩展到很多图表、很多服务实例、或希望重启不重算 embedding,pgvector 很合适。

pgvector 的典型落地形态(怎么替换)

  • 表结构(示例):chart_embeddings(chart_id text primary key, chart_json jsonb, embedding vector(d), updated_at timestamptz)
  • 写入:启动或检测到 dns.json 更新时,重新向量化并 upsert
  • 查询:用户问题 embedding 后,用余弦/内积距离做 TopK
    • 常见:ORDER BY embedding <=> :query_vec LIMIT 3(具体算子随你选择的距离类型)
  • 索引:数据量上来后再加 HNSW/IVFFlat(小数据可以先不加)

如果你要我做"pgvector 版",需要确认两点:

  • 是否接受"不再是纯内存"(会持久化到 PostgreSQL)
  • 你们 PostgreSQL 是否允许装扩展 pgvector(通常需要 DBA 执行 CREATE EXTENSION vector;
相关推荐
杨浦老苏35 分钟前
AI原生笔记应用Tolaria
笔记·ai·markdown·obsidian
@蔓蔓喜欢你1 小时前
数据可视化入门:让你的数据说话
人工智能·ai
Mininglamp_27182 小时前
从单体大模型到Agent网络:当AI互联网取代信息互联网,底层架构需要怎么变?
人工智能·ai·ai agent·moa·分布式ai·多agent协作·scaling out
俊哥V3 小时前
每日 AI 研究简报 · 2026-05-18
人工智能·ai
多年小白4 小时前
兆易创新分析
大数据·人工智能·ai·金融·区块链
搬砖的小码农_Sky4 小时前
AI Agent:MCP介绍和具体实现方案
人工智能·机器学习·ai·人机交互·agi
一切皆是因缘际会6 小时前
AI低代码开发实战:轻量化部署与多场景落地
人工智能·深度学习·低代码·机器学习·ai·架构
chen_2279 小时前
KZPROJ Git Diff AI 审查工具
git·ai·claude·kanzi
企服AI产品测评局9 小时前
2026委外加工管控实测:AI工具全流程跟踪能力横向对比与实在Agent深度测评
人工智能·ai·chatgpt
Ting-yu10 小时前
Spring AI Alibaba零基础速成(2) ---- Ollama安装与使用
java·后端·spring·ai