rag

小何code5 小时前
embedding·向量数据库·rag·检索增强生成·llm应用
人工智能【第52篇】RAG系统实战:检索增强生成技术详解作者的话:大语言模型虽然强大,但存在知识截止、幻觉等问题。RAG(检索增强生成)技术通过将外部知识库与LLM结合,让模型能够基于最新、最准确的信息回答问题。本文将深入解析RAG的原理、架构设计,并带你从零构建一个完整的RAG系统!
提笔了无痕6 小时前
数据库·ai·rag
RAG存储策略中.md格式的切片与存储怎么处理先说结论:语法结构+语义切片+父子检索Markdown 不是纯文本,也不是富文本,它恰好站在中间——既有明确的语法结构,又以纯文本形态存在。这给了你三种切片策略完美的施展空间:
张彦峰ZYF9 小时前
数据库·大模型·rag
检索增强生成(RAG)系统的基础:全面深入矢量数据库目录一、快速走进矢量数据库(一)从“照片检索”理解向量数据库的相似性搜索机制(二)同一句话的不同说法:向量数据库如何找到“同一个意思”?
格桑阿sir11 小时前
ai·大模型·llm·embedding·agent·检索增强·rag
10-大模型智能体开发工程师:RAG检索增强生成系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文详解RAG技术——解决LLM知识局限(训练数据截止、私有数据未知、专业领域不精)的核心方案,梳理RAG流程(离线索引:文档→分块→嵌入→向量数据库;在线查询:嵌入→向量检索→Top-K→拼接到Prompt→LLM生成),详解关键技术(分块策略、嵌入模型选择、向量数据库选型、混合检索、重排序),提供最简RAG和生产级RAG架构代码,以及常见问题优化。
qcx2314 小时前
人工智能·rag·评测
【系统学AI】15 RAG评测体系:RAGAS四维+TruLens+ARES全套方案title: “RAG评测体系(2026版):RAGAS四维+TruLens+ARES全套方案” excerpt: “Faithfulness/Answer Relevancy/Context Precision/Context Recall四维评测+LLM-as-Judge最佳实践+持续监控+A/B测试” cover: rag-evaluation-cover.png tags: RAG评测, RAGAS, TruLens, ARES, LLM-as-Judge, 评测框架
caicongyang15 小时前
rag·llmwiki
LLM Wiki 深度解读与接入指南围绕一个常见误解展开:llmwiki 不是"提前把文档解析成 wiki"的 RAG,而是把 LLM 当成 wiki 编辑员的脚手架。本文先讲清楚架构,再说怎么把它当知识库接到 Claude Code 这类 agent 上替代 RAG。
Mr.Daozhi1 天前
前端·数据库·langchain·大模型·gradio·rag·科研工具
RAG 进阶实战:跑通 Demo 后我连续翻了 6 次车,逐一修复才真正可用(含 Gradio Web 版)写在前面: 本文是本地 RAG 文献知识库的进阶实战篇,假设你已经完成了 WSL2 + Ollama + ChromaDB 的基础环境搭建。如果还没搭好,建议先看入门篇打好基础,再来看本文。
Mr. zhihao2 天前
python·rag·bm25
BM25 混合检索详解:为什么向量检索不够,还要加一个关键词检索本文用一个国标 RAG 的真实查询场景,说明 BM25 解决了什么问题、什么时候必须用它、以及怎么和向量检索做混合。
虾..2 天前
人工智能·llm·rag
大模型认识我们平常日常使用的豆包,千问,deekseep,chatgpt其实都是大语言模型。例如我们想学会⼀⻔外语,但没有⽼师给出题和批改。怎么办?
亦暖筑序2 天前
知识图谱·neo4j·向量数据库·rag·spring ai·graphrag
GraphRAG vs 传统向量RAG:Spring AI实战对比传统向量RAG找答案快,但多跳推理弱。GraphRAG能理清实体关系,但构建成本高。什么时候用什么?看完这篇你就清楚了。
染指11103 天前
人工智能·langchain·rag
12.LangChain框架4-输出解释器内容参考于:图灵AI大模型全栈LangChain输出解释器,大模型的返回数据是可以进行限制的,之前是使用的提示词进行的限制,就是说可以让大模型给我们返回XML、JSON、CSV(以列表形式返回)
SLD_Allen3 天前
架构·rag·agentic rag·classic rag·graph rag
RAG三大主流架构:Classic RAG、Graph RAG、Agentic RAG的区别绝大多数团队第一次将大模型接入业务系统时,都会萌生同一个想法:能不能让AI直接解答公司内部文档相关的问题?
2601_957882243 天前
重构·音视频·geo·rag·多模态模型
多模态RAG与视觉红利:GEO(生成式引擎优化)中的图片与视频资产重构策略大语言模型(LLM)的演进速度超乎想象。随着 GPT-4o、Gemini 1.5 Pro 以及国内诸多原生多模态大模型的发布,AI搜索引擎(如各大厂的AI助手、智能搜索插件)的输入输出已经不再局限于纯文本。
小当家.1053 天前
数据库·人工智能·postgresql·rag
PostgreSQL 做向量数据库:pgvector 在 RAG 中的实战与多场景适配你可能不需要一个独立的向量数据库。做 RAG 的第一步是选向量数据库。市面上的选项很多:Milvus、Qdrant、Weaviate、Pinecone、Chroma……但对于已经在用 PostgreSQL 的 Java 项目来说,有一个选项经常被低估——pgvector。
jiayong233 天前
ai·架构·rag·智能体
RAG系列(三):实践案例与高级优化Python客户端示例:自动从用户问题中提取过滤条件:支持多轮对话,保持上下文:让LLM自主决定何时检索:
java1234_小锋4 天前
java·人工智能·spring·rag
什么是 RAG(检索增强生成)?请简述 Spring AI 实现 RAG 的完整流程,包括涉及的核心组件。RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索和自然语言生成(NLG)技术的模型。其核心思想是,在生成文本之前,首先通过检索机制获得相关的外部信息,以增强生成内容的质量和准确性。这种方法特别适用于需要丰富知识或上下文信息的应用场景,例如问答系统、聊天机器人和内容生成。
中间件XL4 天前
rag·ai agent·智能体·spring ai
ai-agent框架spring ai/alibaba(四) RAGsaa是java的ai agent框架,本系列将深入剖析 Spring AI Alibaba 的源码实现与核心原理,不仅可以指导agent的开发,更可以改造框架,增加新特性
小碗羊肉4 天前
笔记·agent·rag
【Agent笔记 | 第三篇】RAG优化目录1. 为什么要加 Rerank(重排)?2. Recall@K 和 Precision@K 怎么取舍?
填满你的记忆4 天前
java·ai·agent·rag
《RAG 完整工作流程详解》在前一篇文章中,我们聊了什么是 RAG 以及为什么它会成为当前企业级 AI 项目的“标配”。简单来说,RAG 就是让大模型在回答问题前先“开卷翻书”。
Cosolar4 天前
人工智能·面试·大模型·agent·rag
2026 年 AI 开源生态全景图数据来源:GitHub API | 采集日期:2026-05-27 | 所有数据可查证