langchain中的检索器

检索器汇总

检索器名称 📛 核心概念 💡 典型应用场景 🎯 特点 ⚡ 基础代码示例 🛠️
VectorStore Retriever -2-6 基于向量相似度进行语义搜索 语义搜索、基于文档的问答系统-2 • 理解语义,处理同义词和复杂查询 • 依赖嵌入模型质量-2 • 支持多种向量库(Chroma, FAISS等)-2 retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 4}) -2
BM25 Retriever -1-2 基于BM25算法的关键词匹配搜索 传统搜索、关键词驱动的问答-2 • 计算成本低,无需嵌入模型-2 • 依赖文本字面匹配,不支持语义搜索-2 • 快速、轻量,适合离线或资源受限场景-4 retriever = BM25Retriever.from_documents(docs) retriever.k = 4 -1-2
Ensemble Retriever -1-2-10 融合多种检索器结果,取长补短 需要综合关键词和语义的复杂搜索、高覆盖率检索-2-4 • 结合关键词搜索和语义搜索优点-2-10 • 支持加权融合不同检索器结果-1-2 • 通常能获得更高的召回率和精准度-2 ensemble_retriever = EnsembleRetriever(retrievers=[bm25_retriever, vector_retriever], weights=[0.3, 0.7]) -1-2
MultiQuery Retriever -1-2 使用LLM为原始查询生成多个相关问题进行检索 查询表达不明确、需要提高检索全面性的场景-2 • 通过多查询变体提高召回率-2 • 适合处理复杂查询-2 • 会增加一定的计算开销 retriever = MultiQueryRetriever.from_llm(retriever=base_retriever, llm=llm) -1-2
Contextual Compression Retriever -1-2-4 对检索到的文档进行压缩和精炼,提取最相关内容 文档内容冗长、需要提取关键信息、提高问答质量-2-4 • 有效减少噪声,输出更聚焦的上下文-4 • 大幅提升生成模型回答质量-4 • 增加计算开销,但提升精准度-2 compressor = LLMChainExtractor.from_llm(llm) compression_retriever = ContextualCompressionRetriever(base_compressor=compressor, base_retriever=base_retriever) -1-2
MultiVector Retriever -3-4 为单个文档生成多个向量表示(如摘要、小 chunk、假设问题) 长文档检索、技术文档或论文检索、多模态知识库-3-4 • 提高检索精度,支持细粒度匹配-3 • 允许通过摘要或假设性问题来检索完整文档-3 • 索引体积相对较大 retriever = MultiVectorRetriever( vectorstore=vectorstore, byte_store=store, id_key=id_key )
相关推荐
gentle coder15 分钟前
【langchain】AI应用开发框架
langchain·llm·rag
OPEN-Source2 小时前
大模型实战:把 LangChain / LlamaIndex 工作流接入监控与告警体系
人工智能·langchain·企业微信·rag
重生之我要成为代码大佬3 小时前
LangChain-多任务应用开发
langchain·大模型·agent
doll ~CJ4 小时前
Large Language Model(LLM)应用开发学习实践(三)
langchain·llm·提示词工程·ai应用
玄同7655 小时前
LangChain v1.0+ 与 FastAPI 中间件深度解析:从概念到实战
人工智能·中间件·langchain·知识图谱·fastapi·知识库·rag
猫头虎5 小时前
2026全网最热Claude Skills工具箱,GitHub上最受欢迎的7大Skills开源AI技能库
langchain·开源·prompt·github·aigc·ai编程·agi
朱元禄6 小时前
AI Agent 实战课程 之 《RAG 闭环实操:RAG 闭环实操(讲师逐字稿)DeepSeek + LangChain》
人工智能·langchain
伊甸36 小时前
基于LangChain4j从0到1搭建自己的的AI智能体并部署上线-1
java·langchain·prompt
UQI-LIUWJ8 小时前
Langchain笔记:模型
笔记·langchain
gentle coder8 小时前
【langchain】agent部署的基础入门代码(持续更新中~)
python·langchain·react