MultiVector 多向量检索

这是什么?

MultiVector (多向量索引)是 LangChain 的一种高级检索技术。它的核心思想是:为每个文档生成多个假设性问题,将这些问题向量化用于检索,但最终返回的是原始文档

核心原理:

markdown 复制代码
原始文档 → LLM生成假设性问题 → 问题向量化存储
                ↓
         用户查询 → 向量检索 → 匹配假设性问题 → 返回原始文档

有什么用?

主要用途: • 电商产品搜索 - 用户可能用各种方式描述产品需求 • 文档问答系统 - 用户提问方式与文档表述不一致 • 知识库检索 - 提高检索准确率和召回率 • 客服系统 - 匹配用户多样化的提问方式

解决问题:传统向量检索中,文档表述与用户查询可能语义不匹配。MultiVector 通过生成多个假设性问题增加匹配概率。


示例代码

python 复制代码
from typing import List
from pydantic import BaseModel, Field
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_core.documents import Document

# 1. 定义假设性问题的数据结构
class HypotheticalQuestions(BaseModel):
    """生成假设性问题"""
    questions: List[str] = Field(
        description="假设性问题列表,类型为字符串列表",
    )

# 2. 构建生成假设性问题的 prompt
prompt = ChatPromptTemplate.from_template(
    "生成一个包含3个假设性问题的列表,这些问题可以用于回答下面的文档:\n\n{doc}"
)

# 3. 创建 LLM 并绑定结构化输出
llm = ChatOpenAI(model="moonshot-v1-8k", temperature=0)
structured_llm = llm.with_structured_output(HypotheticalQuestions)

# 4. 创建链应用
chain = (
    {"doc": lambda x: x.page_content}
    | prompt
    | structured_llm
)

# 5. 调用链生成假设性问题
hypothetical_questions = chain.invoke(
    Document(page_content="我叫慕小课,我喜欢打篮球,游泳")
)

print(hypothetical_questions.questions)
# 输出示例:
# [
#   "慕小课喜欢什么运动?",
#   "谁喜欢打篮球和游泳?",
#   "慕小课的兴趣爱好是什么?"
# ]

流程图

markdown 复制代码
┌─────────────────────────────────────────────────────────────┐
│                    MultiVector 检索流程                      │
└─────────────────────────────────────────────────────────────┘

【索引构建阶段】

原始文档集合
     │
     ▼
┌─────────────────┐
│   遍历每个文档    │
└────────┬────────┘
         │
         ▼
┌─────────────────────────────────┐
│   LLM 生成假设性问题(3-5个)      │
│   - "这个文档可能回答什么问题?"     │
└────────┬────────────────────────┘
         │
         ▼
┌─────────────────────────────────┐
│   将假设性问题进行 Embedding      │
│   (问题 → 向量)                   │
└────────┬────────────────────────┘
         │
         ▼
┌─────────────────────────────────┐
│   存储到向量数据库                 │
│   - key: 问题向量                  │
│   - value: 原始文档                │
└─────────────────────────────────┘


【检索阶段】

用户查询
     │
     ▼
┌─────────────────────────────────┐
│   将查询转向量 (Query Embedding)  │
└────────┬────────────────────────┘
         │
         ▼
┌─────────────────────────────────┐
│   向量相似度搜索                   │
│   (找出最相似的假设性问题)          │
└────────┬────────────────────────┘
         │
         ▼
┌─────────────────────────────────┐
│   返回假设性问题对应的原始文档      │
└────────┬────────────────────────┘
         │
         ▼
┌─────────────────────────────────┐
│   使用检索到的文档回答用户查询      │
└─────────────────────────────────┘
相关推荐
zihao_tom6 分钟前
Spring Boot(快速上手)
java·spring boot·后端
Bear on Toilet34 分钟前
基于Deepseek(C++)的SSE协议流式响应实现方案
chrome·后端·deepseek接入
didiplus1 小时前
Python 入门第三课:让程序"开口说话":90% 新手都忽略的输入输出技巧
后端
明月_清风1 小时前
宿命的对决:深度对比 JavaScript 与 Python 的异步进化论
后端·python
明月_清风1 小时前
别再纠结 Conda 了!2026 年,uv 才是 Python 环境管理的唯一真神
后端·python
salipopl1 小时前
Spring 中的 @ExceptionHandler 注解详解与应用
java·后端·spring
英俊潇洒美少年1 小时前
React 最核心 3 大底层原理:Fiber + Diff + 事件系统
前端·react.js·前端框架
我命由我123451 小时前
React Router 6 - 概述、基础路由、重定向、NavLink、路由表
前端·javascript·react.js·前端框架·ecmascript·html5·js
LJianK11 小时前
java封装
java·前端·数据库
yaaakaaang1 小时前
(四)前端,如此简单!---Promise
前端·javascript