为什么采用多路检索而不是单一向量检索?

你在企业知识库里搜一个工单号:"WO-20240315-001"。

纯向量检索给你的结果是什么?"2024年3月的工单汇总"、"工单处理流程"......就是没有你要的那个工单。

因为它不懂精确匹配,它只懂"大概意思"。


这就是为什么做企业知识检索,不能只用一种检索方式。


向量检索这两年特别火,语义理解确实强。你说"最近有什么难搞的工单",它能懂你的意思。

但你搜"WO-20240315-001"------抱歉,在向量空间里,"WO-20240315-001"和"WO-20240315-002"的距离,比它跟"工单"的距离还近。它分不清。

而企业场景里,用户的需求是混杂的。有时候是模糊搜索,有时候是精确查询,有时候是"张三到底负责哪个项目"。

单一检索方式,不管选哪个,都会漏。


正确的做法是多路检索------每个通道干自己擅长的事:

向量通道:管语义理解,召回调性相似的文档。 关键词通道:管精确匹配,BM25 搞定编号、代码查询。 知识图谱通道:管实体关系,回答"谁负责什么"这类问题。

三个通道各查各的,结果用 RRF 算法融合排序。

而且不一定要全跑。一个查询路由模块先判断------是精确查询?优先走关键词。是概念问题?优先走向量。是关系问题?启用图谱通道。


结果很漂亮:

精确编号查询的命中率,从 30% 直接飙到 98%。

不是向量检索不好。是只用一种工具的人,永远打不过会用工具箱的人。

相关推荐
拾光拾趣录1 小时前
Agent 编排器是怎么设计的?为什么这样设计?
人工智能
拾光拾趣录1 小时前
为什么选择 ReAct 模式而不是 Plan-and-Execute?
人工智能
武子康2 小时前
调查研究-196 CEO-Bench:Agent 不再只是“做任务“,而是要学会“经营一个系统“
人工智能
用户329901675052 小时前
把AI返回的Markdown表格渲染成可排序表格
人工智能
还好还好不是吗2 小时前
MatrixMedia HTTP 发布接口:让 AI 工作流直接驱动多平台视频发布
人工智能
贵慜_Derek2 小时前
复杂系统没法一把梭重构:Semi-Autoresearch 怎么小步迁移还不掉功能
人工智能·agent·ai编程
ctxinf2 小时前
Vercel Eve 实际上手初探
人工智能
用户5191495848452 小时前
利用ShellcodePack实现DLL劫持与COM对象劫持技术详解
人工智能·aigc
武子康2 小时前
调查研究-195 从 AmEx 支付系统看 Cell-based Architecture:真正的高可用,不是无限重试,而是控制失败边界
人工智能·openai·agent