rag

代码随想录15 小时前
人工智能·大模型·rag·ai应用开发
RAG大厂面试题汇总:向量检索、混合检索、Rerank、幻觉处理高频问题大模型系列教程尽在卡码笔记今年知识星球里,录友反馈最多的面试变化就是:RAG 成了必考项。不管你投的是大模型应用开发、LLM 工程、还是 AI 后端,面试官都会问:“你做过 RAG 吗?检索策略怎么设计的?”
BeforeEasy17 小时前
llm·agent·rag
结合Agent的RAG技术梳理【详细版】研究时间:2026年4月15日 | 所属领域:人工智能 | 研究对象类型:技术概念/技术范式Agent的RAG(Retrieval-Augmented Generation)技术是一种将检索增强生成与智能体(Agent)相结合的AI范式,它让Agent能够自主判断何时检索、如何检索、以及如何将检索结果整合到推理过程中,从而突破大语言模型的知识边界,实现更准确的问答和更可靠的决策。
给自己做减法20 小时前
python·ai编程·rag
RAG调参实践一rewrite的提示词是 你是黄金回收收费检索助手。 任务: 将问题改写为适合“收费计算公式知识库”检索的关键词查询。 要求: - 简洁(3~6个词) - 包含计算公式、回收价、服务费、打款等关键词 - 不包含流程相关内容 问题: {{#1776067848354.question#}}
羑悻的小杀马特1 天前
langchain·检索器·rag
LangChain 检索器与 RAG 系统的深度解析与应用检索系统(Information Retrieval System, IR System) 是一个万亿美元级的用户信息需求、从大规模数据集合中、自动、非结构化的数据检索合适、排序并返回相关文档技术。指导用户返回相关文档的计算机系统。
Flying pigs~~2 天前
人工智能·开源·大模型·agent·dify·rag
Dify平台入门指南:开源LLM应用开发平台深度解析Dify是一款开源的LLM应用开发平台,融合了后端即服务(BaaS)的理念,让开发者可以快速搭建生产级的生成式AI应用。即使是非技术人员,也能参与到AI应用的定义和数据运营中。
SunnyRivers2 天前
优化·rag·评估
RAG 评估与优化在本综合教程中,学习如何使用 LangChain 评估和优化 RAG(检索增强生成)系统。掌握 RAGAS 框架、A/B 测试策略、性能指标以及面向生产环境的 RAG 系统分步优化技术。
Java后端的Ai之路3 天前
人工智能·python·langchain·rag·lcel
当大模型开始“水土不服“:从通才到专才的进化论——Fine-tuning 企业级实战全攻略对了,分享一个我最近常看的AI人工智能入门学习渠道,讲得挺有章法的,不端着也不故弄玄虚。不感兴趣划走就行,感兴趣的可以自己去验证一下。
大模型RAG和Agent技术实践3 天前
人工智能·dify·rag
项目实战:深入剖析 Dify 知识库管理系统的 RBAC 权限设计与实现前文发过一篇“深度集成Dify API:企业级RAG知识库管理平台解决方案”的文章,提供了基于Dify API 实现的一个企业级知识库管理平台。但是对于企业级需求,知识库的权限管理是不可或缺的,本项目就此在以前项目的基础上进一步提供了完整的 RBAC 权限管理体系,方便广大网友实际使用。
庄小焱3 天前
人工智能·ai·向量数据库·ai大模型·rag·rag索引·索引构建与优化
【AI模型】——RAG索引构建与优化本文系统介绍了RAG(检索增强生成)系统中的索引构建与优化技术。核心内容包括:向量嵌入(Embedding)的原理、发展历程及选型方法;多模态嵌入技术(以CLIP和bge-visualized-m3为例);向量数据库(FAISS、Milvus等)的工作机制与实战应用;以及两种关键索引优化策略——上下文扩展优化(句子窗口检索)和结构化索引优化。文章还探讨了LLM知识时效性、模型更新机制及框架选择等延伸问题,为构建生产级RAG系统提供完整技术指南。
庄小焱4 天前
ai·rag·ai模型·rag检索优化
【AI模型】——RAG检索优化混合检索(Hybrid Search)是一种结合了稀疏向量(Sparse Vectors) 和 密集向量(Dense Vectors) 优势的先进搜索技术。旨在同时利用稀疏向量的关键词精确匹配能力和密集向量的语义理解能力,以克服单一向量检索的局限性,从而在各种搜索场景下提供更准确、更鲁棒的检索结果。
深念Y4 天前
数据库·人工智能·neo4j·图论··向量·rag
图数据库 vs 向量数据库:AI时代的两个“最强大脑”一个管“关系”,一个管“相似”,别再傻傻分不清最近在开发一个AI Agent项目时,遇到了一个有趣的问题:用户问“找和我兴趣相似的朋友”和“找朋友的朋友的朋友”,这两个需求看起来都是“找人”,但背后的技术选型却完全不同。
Alice-YUE4 天前
前端·语言模型·rag
AI对话为什么需要RAG本质上是通过rag解决达模型回答不可靠的问题,前端的核心价值在于将检索结果结构化展示,并与流式生成过程融合。
给自己做减法4 天前
知识库·rag
知识库检索,ragdify知识库检索当使用dify的时候,发现可以通过文件等方式直接导入知识库,但是发现一个离奇的事情,就是导入的文档,直接搜素无法找到答案,查看文档后,发现文档被定义了一些关键字。 经过测试发现,只有按照关键字查找,才有办法找到知识库内容。 原来dify默认是采用经济类型,就是关键词检索(BM25)为主,0 token消耗,有点类似MySQL的精准命中。
念念不忘 必有回响5 天前
langchain·rag
RAG 入门第三课:给你的知识库装上大脑(基于LangChain与Qwen3.5的本地RAG系统搭建)在上一篇文章中,我们成功把 PDF 文档变成了向量,存进了 ChromaDB 这个“图书馆”。但这时候的数据库是“死”的——它只是一堆数字,不会说话。
庄小焱6 天前
大模型·rag·ai模型·ai系统·ai算法
【AI模型】——RAG技术简介与实战示例本文系统介绍了RAG(检索增强生成)技术,阐述其通过结合LLM参数化知识与外部非参数化知识解决大模型幻觉、知识滞后等问题的核心机制,对比了Naive/Advanced/Modular三阶段架构演进,并详细讲解了从数据准备、索引构建到检索优化的完整工程实践,包括文本分块策略、向量数据库选型及FAISS/rerank等关键优化方向。
SunnyRivers6 天前
大模型·rag·高级
高级 RAG 技术教程学习如何在本综合教程中使用 LangChain 实现高级 RAG 技术。逐步掌握多查询搜索、父子分块、重排序策略以及融合技术,以达到生产级别的准确度。
正在走向自律6 天前
langchain·向量数据库·rag·企业级架构
从0到1构建企业级RAG系统:基于LangChain+向量数据库的完整实战摘要:本文深入讲解了构建生产级RAG(检索增强生成)系统的完整方案。主要内容包括:1)系统架构设计,涵盖索引构建和查询处理全流程;2)向量数据库选型对比与Milvus实战部署;3)文档智能分块与向量化处理策略;4)查询优化技术,包括重写、扩展和混合检索;5)重排序优化与Cross-Encoder应用;6)完整API服务实现与Docker部署方案。文章重点分析了企业级RAG的核心挑战,如检索精度、系统性能和数据安全等,并提供了性能优化策略和演进路线建议。通过结合密集/稀疏向量检索、查询重写和重排序等技术,可
Flying pigs~~6 天前
数据库·人工智能·缓存·大模型·milvus·知识库·rag
从零到一构建企业级 RAG 问答系统:一个完整的模块化实践指南在人工智能技术飞速发展的今天,大语言模型(LLM)展现出了惊人的能力。然而,如何让 LLM 真正落地到垂直领域,解决实际问题,仍然是一个值得深入探讨的课题。RAG(Retrieval-Augmented Generation,检索增强生成)作为目前最成熟的解决方案之一,通过将外部知识库与 LLM 结合,有效解决了模型知识更新滞后、幻觉等问题。
Flying pigs~~6 天前
agent·milvus·rag·智能体·检索增强生成
RAG 项目完整学习笔记与总结这是一个生产级的多层 RAG 问答系统,核心特点:多级检索降级:Redis 缓存 → BM25 关键词检索 → Milvus 向量检索,层层递进