向量检索

INFINI Labs1 天前
向量检索·knn·easysearch·ai agent·mem0·mcp
用 Easysearch 给 AI Agent 装上长期记忆:Mem0 集成实战你有没有遇到过这样的场景:昨天花了半小时跟 AI 把一个 Bug 的根因讲清楚了,今天新开一个对话,对方又一脸懵地从零问起。每次都要重新交代背景,像是在跟一个永远刚入职的实习生打交道。
deephub16 天前
人工智能·python·大语言模型·向量检索·rag
从检索到回答:RAG 流水线中三个被忽视的故障点RAG 流水线部署完毕、检索正常运行、LLM 按部就班地生成回答、用户也在持续收到响应,这一切看上去运转良好。但有一个问题大多数工程师从来不问:这些回答真的对吗?
deephub18 天前
人工智能·python·机器学习·embedding·向量检索
向量相似性搜索详解:Flat Index、IVF 与 HNSW要理解向量搜索先要弄清楚为什么需要向量数据库,关系型数据库处理结构化数据得心应手。所谓结构化数据就是那些具有固定列的表格数据,比如说:姓名、年龄、薪资、日期。这类数据精确匹配查询很简单:"Age > 25"或"Name = Subham"就能拿到想要的结果。
deephub21 天前
人工智能·python·大语言模型·embedding·向量检索
向量数据库对比:Pinecone、Chroma、Weaviate 的架构与适用场景向量数据库存储 Embedding,也就是文本、图像或音频的数值表示,并在查询时检索语义上最接近的结果。RAG 系统正是基于这一机制运作。本文对比三个主流方案,每个都附有 Python 代码,均来自实际在生产环境中使用三者的经验。 三种选择:Pinecone 用于生产级规模,Chroma 用于本地原型开发,Weaviate 用于混合搜索。
YoanAILab25 天前
知识库·向量检索·rag·bm25·rerank
RAG 知识库检索参数怎么调?一篇讲清 top_k、BM25、Rerank、各种阈值的区别很多人在刚开始做知识库问答、Dify 工作流、RAG 系统时,最容易遇到的问题不是“模型不够强”,而是:
尽兴-1 个月前
大数据·elasticsearch·jenkins·向量检索·去哪嗯检索·模糊匹配·地理空间查询
Elasticsearch Query DSL 进阶:高频查询范式与实战排坑本文基于 ElasticSearch 8.x 版本,详细总结 Query DSL(Domain Specified Language,领域专用语言)的核心用法、各类查询场景及实操技巧。Query DSL 是 ES 中最强大的检索方式,通过 Rest API 传递 JSON 格式请求体与 ES 交互,支持精确匹配、全文检索、布尔组合等多种复杂查询,兼顾功能性与实操性,同时配套思维导图梳理知识框架,助力开发者快速掌握并灵活运用 Query DSL 完成各类检索需求。
在未来等你1 个月前
langchain·知识库问答·向量检索·rag·ai agent·检索增强生成·技能开发
AI Agent Skill Day 11:RAG Retrieval技能:检索增强生成的技能封装【AI Agent Skill Day 11】RAG Retrieval技能:检索增强生成的技能封装在“AI Agent Skill技能开发实战”系列的第11天,我们聚焦于知识检索技能模块的核心能力——RAG(Retrieval-Augmented Generation)检索增强生成技能的封装。随着大语言模型(LLM)在开放域问答、智能客服、企业知识库等场景中的广泛应用,单纯依赖模型内部参数的知识已难以满足准确性、时效性和领域专业性的要求。RAG通过将外部知识库与生成模型动态结合,显著提升了回答的可靠性与
lihuayong2 个月前
人工智能·全文检索·向量检索·混合检索
混合检索架构:为什么BM25与向量搜索缺一不可实际生产环境中,主流方案是将两者结合:BM25不会消失,就像计算器没有取代算盘在特定场景的价值一样。这两种技术代表了信息检索的两个维度:精确性 vs. 语义性。真正的智能搜索系统需要同时掌握"字面"和"深意"。
Johnny.Cheung2 个月前
llm·向量检索·rag
面试:LLM RAG的三种算法和使用场景RerankingRAG(Retrieval-Augmented Generation)整体分为三个阶段:索引构建 → 检索 → 生成。
猿小羽3 个月前
自然语言处理·知识库·向量检索·rag·ai实战·检索增强生成
RAG 入门与实践指南近几年,生成式 AI 模型的发展速度惊人。然而,生成式 AI 往往受限于其训练数据,容易产生不可靠答案。为此,业界提出了溯源、更精准的生成方案——检索增强生成(Retrieve-augmented generation),简称 RAG。本文将全面解析 RAG 的概念、原理、优势以及如何成功地实践。
递归尽头是星辰3 个月前
人工智能·大模型·向量检索·rag·spring ai·向量库
大模型与向量检索的融合:从核心原理到 Spring AI 落地本文系统梳理大模型与向量检索的完整知识体系,从基础概念、核心技术模块出发,深入剖析二者基于 RAG 的协同融合机制,结合Spring AI实现工业级落地实践,并针对工程化部署、性能优化给出可落地的解决方案。内容覆盖嵌入模型、向量检索算法 / 数据库、RAG 基础 / 进阶流程、多场景应用。
deephub4 个月前
人工智能·大语言模型·向量检索·rag
大规模向量检索优化:Binary Quantization 让 RAG 系统内存占用降低 32 倍当文档库规模扩张时向量数据库肯定会跟着膨胀。百万级甚至千万级的 embedding 存储,float32 格式下的内存开销相当可观。
七夜zippoe5 个月前
架构·大模型·多模态·向量检索·clip
多模态模型实践 - 图文跨模态检索实战教程目录摘要1 引言:多模态检索的时代价值与挑战2 技术原理:跨模态检索的架构设计2.1 核心架构设计理念
行走正道5 个月前
microsoft·架构·向量检索·用户画像·matechat
MateChat记忆化引擎设计:长期记忆与用户画像构建方案目录📖 摘要1. 🧠 记忆化引擎的设计哲学:为什么需要"有记性"的AI?1.1. 记忆的分类与价值定位
DashVector6 个月前
数据库·数据仓库·人工智能·算法·向量检索
向量检索服务 DashVector产品计费重要本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。本文主要介绍向量检索服务 DashVector的计费方式。
deephub6 个月前
数据库·人工智能·sqlite·大语言模型·向量检索·智能体
构建有记忆的 AI Agent:SQLite 存储 + 向量检索完整方案示例现在的 Agent 系统有个很明显的问题 —— 会话一结束,什么都忘了。这不是个技术缺陷,但是却限制了整个系统的能力边界。Agent 可以做推理、规划、执行复杂任务,但就是记不住之前发生过什么。每次对话都像是第一次见面,这种状态下很难说它真正"理解"了什么。
OceanBase数据库官方博客9 个月前
ai·oceanbase·分布式数据库·向量检索·混合检索
OceanBase 混合检索解读:向量+标量,应该优先查哪个混合检索(Hybrid Search)作为AI应用中的常用技术,需要融合多模数据和多种检索技术,从而实现整合不同检索策略,来提升检索的准确性、召回率和适应性。
正在走向自律10 个月前
人工智能·向量检索·生成式 ai·ragflow·智能任务分配·自动化反馈机制·知识库管理模块
探索RAGFlow:解锁生成式AI的无限潜能(2/6)文章摘要:本文介绍了 RAGFlow 这一生成式 AI 领域的新型系统架构,它融合了数据检索与生成式模型,通过多阶段处理、智能任务分配等优势,在智能客服、文档生成等多领域有广泛应用,能提升效率与质量。文章还分析了其技术原理、应用场景、技术优势及未来发展趋势,展现了 RAGFlow 在推动各行业数字化转型和智能化升级中的潜力。
Elastic开源社区1 年前
大数据·elasticsearch·搜索引擎·向量检索
Elasticsearch 向量检索详解相似性搜索:根据向量之间的相似度,找到与目标向量最相似的文档。语义搜索:将文本转换为向量后,进行语义级别的搜索。