基于内存的向量相似度计算,是否可以用PostgreSQL + pgvector进行平替

可以平替,而且是更"工程化"的做法,但取决于你要不要这几个能力:

  • 你现在(内存索引)优点:实现简单、依赖少、延迟低;缺点是重启就丢、多进程/多实例各算各的。
  • pgvector 优点:向量可持久化、多实例共享、可做权限/审计/备份、可用索引(HNSW/IVFFlat)提升检索速度;缺点是多一个数据库依赖、写入/迁移要做、延迟通常略高。

内存方案是最小成本最佳起步;但如果你后面要扩展到很多图表、很多服务实例、或希望重启不重算 embedding,pgvector 很合适。

pgvector 的典型落地形态(怎么替换)

  • 表结构(示例):chart_embeddings(chart_id text primary key, chart_json jsonb, embedding vector(d), updated_at timestamptz)
  • 写入:启动或检测到 dns.json 更新时,重新向量化并 upsert
  • 查询:用户问题 embedding 后,用余弦/内积距离做 TopK
    • 常见:ORDER BY embedding <=> :query_vec LIMIT 3(具体算子随你选择的距离类型)
  • 索引:数据量上来后再加 HNSW/IVFFlat(小数据可以先不加)

如果你要我做"pgvector 版",需要确认两点:

  • 是否接受"不再是纯内存"(会持久化到 PostgreSQL)
  • 你们 PostgreSQL 是否允许装扩展 pgvector(通常需要 DBA 执行 CREATE EXTENSION vector;
相关推荐
92year1 天前
用 browser-use 让 AI 自己操作浏览器:从安装到自动填表全流程
python·ai·浏览器自动化·browser-use
学Linux的语莫1 天前
LlamaFactory微调框架的使用
ai·lora·模型微调
财经资讯数据_灵砚智能1 天前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月6日
人工智能·python·ai·信息可视化·自然语言处理·ai编程·灵砚智能
笨蛋©1 天前
Infra CONVERT 德国标准下的图纸自动化识别与检验计划生成指南
ai·cad·质量管理·制造业·图纸识别
moeyui7051 天前
WSL2中配置Khoj+DeepSeekV4的本地Agents
ai
小七-七牛开发者1 天前
专访 Mainline 作者们:聊聊从代码协作到意图协作
ai·agent·mainline·ai coding
Sirius Wu1 天前
Agent Skill能力建设
人工智能·深度学习·机器学习·ai·语言模型·aigc
要开心吖ZSH1 天前
AI医疗分诊与健康咨询助手agent开发——(0)项目背景与概要
java·ai·agent·健康医疗·rag
哥布林学者1 天前
深度学习进阶(二十八)现代 LLM 的核心架构设计其三:Decoder-Only 下的 KV Cache
机器学习·ai
沉睡的木木夕1 天前
AI Prompt 工程化设计最佳实践(Harness Engineering)
ai·harness-engineering