向量检索

deephub21 小时前
人工智能·python·大语言模型·embedding·向量检索
向量数据库对比:Pinecone、Chroma、Weaviate 的架构与适用场景向量数据库存储 Embedding,也就是文本、图像或音频的数值表示,并在查询时检索语义上最接近的结果。RAG 系统正是基于这一机制运作。本文对比三个主流方案,每个都附有 Python 代码,均来自实际在生产环境中使用三者的经验。 三种选择:Pinecone 用于生产级规模,Chroma 用于本地原型开发,Weaviate 用于混合搜索。
YoanAILab5 天前
知识库·向量检索·rag·bm25·rerank
RAG 知识库检索参数怎么调?一篇讲清 top_k、BM25、Rerank、各种阈值的区别很多人在刚开始做知识库问答、Dify 工作流、RAG 系统时,最容易遇到的问题不是“模型不够强”,而是:
尽兴-12 天前
大数据·elasticsearch·jenkins·向量检索·去哪嗯检索·模糊匹配·地理空间查询
Elasticsearch Query DSL 进阶:高频查询范式与实战排坑本文基于 ElasticSearch 8.x 版本,详细总结 Query DSL(Domain Specified Language,领域专用语言)的核心用法、各类查询场景及实操技巧。Query DSL 是 ES 中最强大的检索方式,通过 Rest API 传递 JSON 格式请求体与 ES 交互,支持精确匹配、全文检索、布尔组合等多种复杂查询,兼顾功能性与实操性,同时配套思维导图梳理知识框架,助力开发者快速掌握并灵活运用 Query DSL 完成各类检索需求。
在未来等你19 天前
langchain·知识库问答·向量检索·rag·ai agent·检索增强生成·技能开发
AI Agent Skill Day 11:RAG Retrieval技能:检索增强生成的技能封装【AI Agent Skill Day 11】RAG Retrieval技能:检索增强生成的技能封装在“AI Agent Skill技能开发实战”系列的第11天,我们聚焦于知识检索技能模块的核心能力——RAG(Retrieval-Augmented Generation)检索增强生成技能的封装。随着大语言模型(LLM)在开放域问答、智能客服、企业知识库等场景中的广泛应用,单纯依赖模型内部参数的知识已难以满足准确性、时效性和领域专业性的要求。RAG通过将外部知识库与生成模型动态结合,显著提升了回答的可靠性与
lihuayong1 个月前
人工智能·全文检索·向量检索·混合检索
混合检索架构:为什么BM25与向量搜索缺一不可实际生产环境中,主流方案是将两者结合:BM25不会消失,就像计算器没有取代算盘在特定场景的价值一样。这两种技术代表了信息检索的两个维度:精确性 vs. 语义性。真正的智能搜索系统需要同时掌握"字面"和"深意"。
Johnny.Cheung2 个月前
llm·向量检索·rag
面试:LLM RAG的三种算法和使用场景RerankingRAG(Retrieval-Augmented Generation)整体分为三个阶段:索引构建 → 检索 → 生成。
猿小羽2 个月前
自然语言处理·知识库·向量检索·rag·ai实战·检索增强生成
RAG 入门与实践指南近几年,生成式 AI 模型的发展速度惊人。然而,生成式 AI 往往受限于其训练数据,容易产生不可靠答案。为此,业界提出了溯源、更精准的生成方案——检索增强生成(Retrieve-augmented generation),简称 RAG。本文将全面解析 RAG 的概念、原理、优势以及如何成功地实践。
递归尽头是星辰2 个月前
人工智能·大模型·向量检索·rag·spring ai·向量库
大模型与向量检索的融合:从核心原理到 Spring AI 落地本文系统梳理大模型与向量检索的完整知识体系,从基础概念、核心技术模块出发,深入剖析二者基于 RAG 的协同融合机制,结合Spring AI实现工业级落地实践,并针对工程化部署、性能优化给出可落地的解决方案。内容覆盖嵌入模型、向量检索算法 / 数据库、RAG 基础 / 进阶流程、多场景应用。
deephub3 个月前
人工智能·大语言模型·向量检索·rag
大规模向量检索优化:Binary Quantization 让 RAG 系统内存占用降低 32 倍当文档库规模扩张时向量数据库肯定会跟着膨胀。百万级甚至千万级的 embedding 存储,float32 格式下的内存开销相当可观。
七夜zippoe4 个月前
架构·大模型·多模态·向量检索·clip
多模态模型实践 - 图文跨模态检索实战教程目录摘要1 引言:多模态检索的时代价值与挑战2 技术原理:跨模态检索的架构设计2.1 核心架构设计理念
行走正道4 个月前
microsoft·架构·向量检索·用户画像·matechat
MateChat记忆化引擎设计:长期记忆与用户画像构建方案目录📖 摘要1. 🧠 记忆化引擎的设计哲学:为什么需要"有记性"的AI?1.1. 记忆的分类与价值定位
DashVector5 个月前
数据库·数据仓库·人工智能·算法·向量检索
向量检索服务 DashVector产品计费重要本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。本文主要介绍向量检索服务 DashVector的计费方式。
deephub5 个月前
数据库·人工智能·sqlite·大语言模型·向量检索·智能体
构建有记忆的 AI Agent:SQLite 存储 + 向量检索完整方案示例现在的 Agent 系统有个很明显的问题 —— 会话一结束,什么都忘了。这不是个技术缺陷,但是却限制了整个系统的能力边界。Agent 可以做推理、规划、执行复杂任务,但就是记不住之前发生过什么。每次对话都像是第一次见面,这种状态下很难说它真正"理解"了什么。
OceanBase数据库官方博客9 个月前
ai·oceanbase·分布式数据库·向量检索·混合检索
OceanBase 混合检索解读:向量+标量,应该优先查哪个混合检索(Hybrid Search)作为AI应用中的常用技术,需要融合多模数据和多种检索技术,从而实现整合不同检索策略,来提升检索的准确性、召回率和适应性。
正在走向自律10 个月前
人工智能·向量检索·生成式 ai·ragflow·智能任务分配·自动化反馈机制·知识库管理模块
探索RAGFlow:解锁生成式AI的无限潜能(2/6)文章摘要:本文介绍了 RAGFlow 这一生成式 AI 领域的新型系统架构,它融合了数据检索与生成式模型,通过多阶段处理、智能任务分配等优势,在智能客服、文档生成等多领域有广泛应用,能提升效率与质量。文章还分析了其技术原理、应用场景、技术优势及未来发展趋势,展现了 RAGFlow 在推动各行业数字化转型和智能化升级中的潜力。
Elastic开源社区1 年前
大数据·elasticsearch·搜索引擎·向量检索
Elasticsearch 向量检索详解相似性搜索:根据向量之间的相似度,找到与目标向量最相似的文档。语义搜索:将文本转换为向量后,进行语义级别的搜索。
大龄码农有梦想1 年前
spring boot·embedding·milvus·向量检索·spring ai
Springboot集成Milvus和Embedding服务,实现向量化检索Milvus 是一款开源向量数据库,专为支持大规模向量检索而设计,特别适用于大模型领域中的应用。本文详细介绍如何利用 Spring Boot 框架集成 Milvus 向量数据库,并通过调用阿里云百炼大模型服务平台所提供的 Embedding服务,实现数据的向量化存储与高效检索。此过程不仅验证了 Milvus 向量数据库的基本能力,还展示了其与先进 AI 服务无缝对接的灵活性。
DashVector1 年前
数据库·数据仓库·人工智能·http·向量检索
如何通过HTTP API更新Doc本文介绍如何通过HTTP API更新Collection中已存在的Doc。说明若更新Doc时指定id不存在,则本次更新Doc操作无效
DashVector1 年前
数据库·人工智能·http·阿里云·向量检索
如何通过HTTP API插入Doc本文介绍如何通过HTTP API向Collection中插入Doc。说明插入Doc时若指定id已存在,已存在的Doc不会被覆盖,本次插入Doc操作无效。