rag

庄小焱17 小时前
大模型·rag·ai模型·ai系统·ai算法
【AI模型】——RAG技术简介与实战示例本文系统介绍了RAG(检索增强生成)技术,阐述其通过结合LLM参数化知识与外部非参数化知识解决大模型幻觉、知识滞后等问题的核心机制,对比了Naive/Advanced/Modular三阶段架构演进,并详细讲解了从数据准备、索引构建到检索优化的完整工程实践,包括文本分块策略、向量数据库选型及FAISS/rerank等关键优化方向。
SunnyRivers21 小时前
大模型·rag·高级
高级 RAG 技术教程学习如何在本综合教程中使用 LangChain 实现高级 RAG 技术。逐步掌握多查询搜索、父子分块、重排序策略以及融合技术,以达到生产级别的准确度。
正在走向自律1 天前
langchain·向量数据库·rag·企业级架构
从0到1构建企业级RAG系统:基于LangChain+向量数据库的完整实战摘要:本文深入讲解了构建生产级RAG(检索增强生成)系统的完整方案。主要内容包括:1)系统架构设计,涵盖索引构建和查询处理全流程;2)向量数据库选型对比与Milvus实战部署;3)文档智能分块与向量化处理策略;4)查询优化技术,包括重写、扩展和混合检索;5)重排序优化与Cross-Encoder应用;6)完整API服务实现与Docker部署方案。文章重点分析了企业级RAG的核心挑战,如检索精度、系统性能和数据安全等,并提供了性能优化策略和演进路线建议。通过结合密集/稀疏向量检索、查询重写和重排序等技术,可
Flying pigs~~1 天前
数据库·人工智能·缓存·大模型·milvus·知识库·rag
从零到一构建企业级 RAG 问答系统:一个完整的模块化实践指南在人工智能技术飞速发展的今天,大语言模型(LLM)展现出了惊人的能力。然而,如何让 LLM 真正落地到垂直领域,解决实际问题,仍然是一个值得深入探讨的课题。RAG(Retrieval-Augmented Generation,检索增强生成)作为目前最成熟的解决方案之一,通过将外部知识库与 LLM 结合,有效解决了模型知识更新滞后、幻觉等问题。
Flying pigs~~1 天前
agent·milvus·rag·智能体·检索增强生成
RAG 项目完整学习笔记与总结这是一个生产级的多层 RAG 问答系统,核心特点:多级检索降级:Redis 缓存 → BM25 关键词检索 → Milvus 向量检索,层层递进
Flying pigs~~1 天前
人工智能·redis·mysql·docker·prompt·milvus·rag
企业级模块化RAG项目(mysql➕redis➕milvus➕模型微调➕bm25➕fastapi➕ollama➕Prompt➕多策略选择)一个完整的 RAG 系统涉及多个技术组件,每个组件的选型都直接影响系统的性能、成本和可维护性。本文档详细分析本项目各项技术选型的考量因素及竞品对比。
rising start1 天前
embedding·dify·rag
RAG入门与在Dify中的简单实践本文将带你完成 RAG 技术从理论到实战的全流程。我们以 长江科技有限公司内部知识库:新员工入职指南问答助手 为例,基于 Dify 平台进行实操演示,每一步都会给出具体的操作指引与最佳实践建议。
究极无敌暴龙战神X2 天前
自然语言处理·llama·rag
RAG基本流程RAG(Retrieval-Augmented Generation,检索增强生成)是一种将外部知识检索与大语言模型(LLM)生成能力相结合的技术,用于提升回答的准确性、减少“幻觉”(Hallucination),并支持私有或实时数据。
竹之却2 天前
人工智能·大模型·检索增强·faiss·rag
【Agent-阿程】AI先锋杯·14天征文挑战第14期-第6天-大模型RAG检索增强生成实战技术标签:人工智能、大模型、RAG、检索增强、LangChain、向量数据库、FAISS大模型训练数据存在时间截止点,无法获取训练后新增的知识,回答易出现过时、错误、幻觉。
guslegend3 天前
人工智能·架构·大模型·rag
第10节:设计高效混合检索架构,提升召回精度RAG与Agent性能调优:第8节:打造可配置,可扩展的自动化预处理流水线Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
Flying pigs~~3 天前
运维·人工智能·docker·容器·大模型·agent·rag
检索增强生成RAG项目tools_01:Docker 极简实战一份写给「只做开发、不做运维」的 AI 工程师的 Docker 学习笔记!总之就是一个字:好!!!Docker 拉取镜像时需要访问 Docker Hub(registry-1.docker.io),但国内网络访问不稳定,即使(●'◡'●)上网了,Docker Desktop 也不会自动使用系统代理。
deephub3 天前
人工智能·大语言模型·embedding·rag
无 Embedding、无向量数据库的 RAG 方法:PageIndex 技术解析PageIndex 是一种无向量、基于推理的检索增强生成(RAG)方法,无需 Embedding、分块或向量数据库即可从长文档中检索答案。
张小泡泡3 天前
论文阅读·人工智能·rag·graphrag
Graph Retrieval-Augmented Generation: A Survey近年来,检索增强生成(RAG)技术在无需重新训练的情况下,成功解决了大语言模型(LLM)面临的诸多难题。通过调用外部知识库,RAG 能够优化大语言模型的输出结果,有效缓解模型幻觉、领域专业知识匮乏以及信息过时等问题。
-许平安-3 天前
c++·笔记·llm·rag·mcp
MCP项目笔记十二(RAG-MCP)这套代码实现了一个完整的 RAG(检索增强生成)工具检索系统,核心职责是:给定用户的自然语言 Query,从一批已注册的工具中找出语义最相关的若干个,最终以 LLM Function Calling 格式返回。
deephub4 天前
人工智能·python·大语言模型·向量检索·rag
从检索到回答:RAG 流水线中三个被忽视的故障点RAG 流水线部署完毕、检索正常运行、LLM 按部就班地生成回答、用户也在持续收到响应,这一切看上去运转良好。但有一个问题大多数工程师从来不问:这些回答真的对吗?
Flying pigs~~4 天前
数据库·redis·缓存·大模型·qa·rag·prompt提示词
RAG前身:基于mysql➕redis➕bm25的传统QA问答系统本文将从一个完整的项目实战出发,详细讲解如何构建一个基于传统检索技术的智能问答系统。我们会逐行分析代码,深入理解每个模块的设计思想、实现细节和优化思路。
念念不忘 必有回响4 天前
rag·切分
RAG 入门第二课:从 PDF 深度解析到智能入库全链路在构建 RAG 系统时,我们常把精力花在调优大模型上,却忽略了最基础也最关键的一环——数据处理。俗话说“垃圾进,垃圾出”,如果文档读取乱码、切分支离破碎,再强大的模型也无法给出精准答案。
Flying pigs~~4 天前
人工智能·agent·milvus·rag·智能体·检索增强生成
检索增强生成RAG项目tools_03:mysql➕redis➕milvus前面我们介绍了Docker部署➕ollama➕logging➕bm25等RAG项目中各个必不可少的tools,本篇主要讲的是mysql➕redis➕milvus!!!
guslegend4 天前
人工智能·大模型·faiss·rag
第9节:FAISS,HNSW还是BM25?如何选择最适合业务的向量检索引擎?如何选择最适合业务的向量检索引擎RAG与Agent性能调优:第8节:打造可配置,可扩展的自动化预处理流水线Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
发光的叮当猫4 天前
人工智能·微调·rag·ai工程
AI工程可能会遇到的一些问题1,检索质量太差,根本没有检索到正确内容原因:embedding不行,相似度算错,语义没对齐。query没有被改写,完全没有上下文,检索失败。