rag

小程故事多_807 小时前
java·开发语言·rag
RAGFlow 分块策略全景与 Book 策略深度解析RAGFlow 一共有 15 种分块策略,定义在 common/constants.py 的 ParserType 枚举中,通过 rag/svr/task_executor.py 的 FACTORY 字典分发到各自的实现模块。
企业知识库布道者8 小时前
人工智能·ocr·私有化部署·知识库·rag·企业知识库
从 OCR 到文档结构理解:MinerU-Popo 对 RAG 文档解析链路的补全MinerU-PopoOCR 解决的是“看见文字”的问题。在文档智能场景里,这一步很重要,但还不够。一个 PDF 被 OCR 之后,通常会得到一组页面级的结果:文本块、标题块、表格块、图片块、坐标、页码,以及一些模型识别出来的版面标签。它们能说明“这一页上有什么”,却不一定能说明“整篇文档在讲什么、这些内容之间是什么关系”。
程序员三明治8 小时前
人工智能·llm·知识库·元数据·rag·java后端
RAG 元数据的作用与管理:让知识库回答可追溯、可过滤、可维护上一篇我们聊了 RAG 中的文本分块(Chunking):如何把长文档拆成适合检索的小块。分块解决的是“长文本如何变成可检索单元”的问题,但它没有回答另一个关键问题:这些文本块从哪里来、属于哪个业务范围、当前是否生效、谁可以查看、出了问题怎么回溯。
虎妞05001 天前
milvus·向量数据库·chroma·rag·weaviate
向量数据库选型指南:Milvus vs Chroma vs WeaviateRAG 架构让向量数据库成为 AI 基础设施核心。与传统数据库不同,向量数据库专为高维向量相似性搜索设计。
染指11101 天前
人工智能·rag·advanced rag
21.RAG进阶(Advanced RAG)-RAG存在的问题(Advanced RAG)内容参考于:图灵AI大模型全栈实现一个RAG的流程:首先加载文件,然后读取文件中的文本,然后分割文本,然后把文本转成向量,然后保存成知识库,然后把我们的问题也转成向量,然后使用问题的向量去知识库中搜索,把搜索到的知识添加到向ai大模型提问的提示词中,然后提交给大模型回答
SiYuanFeng1 天前
人工智能·面试·transformer·agent·rag
大模型 / RAG / Agent 面试高频题这篇文章《大模型 / RAG / Agent 面试基础高频题》,适合准备以下方向:(这里主要是介绍自己的项目,这里就不给出标准答案了)
codefan※1 天前
大模型·llm·向量数据库·rag
Reranker 模型实战:让 RAG 检索精度再提升 20%如果你做过 RAG(Retrieval-Augmented Generation)项目,一定遇到过这个痛点:**向量检索召回了 20 条文档,但真正相关的只有前 3 条,后面全是噪音。**这些噪音不仅浪费 Token,还会干扰 LLM 的推理,导致生成结果质量下降。
中草药z1 天前
java·深度学习·机器学习·阿里云·rag·springai
【RAG】工程化实战:全链路原理复盘 + 方案选型 + 实战高阶玩法🔥个人主页: Ryan🔥专栏:【后端】登神长阶 实战落地后端全路线手册在 AI 圈子里,一直流传着一个心照不宣的秘密:用 LangChain 或 LlamaIndex 几行代码搭一个 RAG(检索增强生成)系统,只需要一个下午;但要让它达到生产环境的落地上线标准,往往需要大半年。
码农飞哥2 天前
python·知识库·向量检索·rag·效果提示
我把RAG召回率从60%提到90%,就改了这两件事💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精通
要开心吖ZSH2 天前
java·ai·agent·健康医疗·rag
AI医疗分诊与健康咨询助手agent开发——(0)项目背景与概要说起来这个想法不是突然冒出来的,是几条线慢慢汇到一起的。我目前在做互联网医院的项目,上线之后发现一个很明显的问题——我们的挂号流程是"直筒式"的:选医院,然后医院各科室列表摆在这儿,你自己选,自己挂。系统不会问你哪里不舒服,也不会帮你判断该挂哪个科。结果就是,患者挂错科的情况时有发生。每次看到客服反馈过来的这类工单,我心里就想:这个环节,明显是能用技术优化的。
星马梦缘3 天前
人工智能·rag·提示词工程·mcp
提示词工程 与 实践 合集大型语言模型本质上是一个黑箱,而提示就是我们与它沟通的唯一接口。就像我们使用自然语言与人交流一样,提示也是我们向LLM下达指令、描述任务、提供上下文的主要方式。
小刘|3 天前
langchain·rag
揭秘RAG:检索增强生成技术解析什么是 RAG?RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了 信息检索 与 大语言模型 的技术框架。它旨在通过引入外部知识源,弥补大模型在事实性、时效性及私有化知识方面的短板。
菜到离谱但坚持3 天前
python·langchain·rag
【小白零基础】RAG+LangChain 搭建私有知识库问答系统(完整可运行代码+超详细教程+避坑指南)收藏⭐ + 点赞👍 + 关注✅ 零基础入门大模型RAG应用,保姆级教程,新手零翻车!哈喽大家好!很多刚入门大模型的小伙伴都有一个疑问:如何让AI学习自己的私有资料?
HappyAcmen3 天前
python·pdf·rag
2.PDF长文档完整读取RAG = 给大模型(比如 ChatGPT、豆包、开源大模型)外挂了一个你自己的私有知识库,让大模型能精准、无差错地回答你私有数据里的内容,不会瞎编、不会用过时的知识。
尽兴-3 天前
rag·混合检索·chunk 分块·rerank 重排
2.2 RAG 体系:RAG、Chunk 分块、Rerank 重排、混合检索Embedding 让文字变成了数字,但光有向量还不够——你需要一整套流程把「用户提问」变成「精准答案」。这就是 **RAG(检索增强生成)**,目前大模型落地最成熟、最实用的技术方案。没有 RAG,LLM 只是一个「能聊但不懂你业务」的聊天机器人;有了 RAG,它才能变成真正懂你的业务助手。
你不是我我3 天前
agent·rag
【Agent 学习日记】Agent 的记忆是如何设计的?短期记忆和长期记忆有什么区别?目录🍕一、Agent 记忆的整体设计框架🍕二、短期记忆 —— 任务的“工作台”🍕三、长期记忆 —— 经验的“知识库”
染指11103 天前
人工智能·python·机器学习·langchain·agent·rag
19.LangChain框架7-LangChain1.0版本使用Agent(中间件实例)内容参考于:图灵AI大模型全栈后面会有专门的Agent详细玩法,这里只是做一个了解1.0的调用方式比0.3版本简单很多
lianyinghhh4 天前
python·低代码·开源·vue·rag·flowgame·ai工作流编排
FlowGame 从零上手:开源 AI 工作流编排框架与 Vue 3 接入实战导读:FlowGame 是一款轻量级、可私有化部署的 AI 工作流编排框架。本文将从零开始,带你完成「克隆仓库 → 启动编辑器 → Vue 3 嵌入 → Python 后端联调」全流程,适合希望在自有业务系统中集成可视化 AI 工作流的开发者
SL-staff4 天前
人工智能·系统架构·私有化部署·rag·ai知识库·llama3·jvs-ai
企业级私有化AI知识库完整搭建指南:从RAG架构到Llama 3落地实践企业内部文档分散、检索效率低下是普遍痛点。基于检索增强生成(RAG)的AI知识库能以自然语言问答方式提升信息获取效率,但公有云服务存在数据安全风险。本文详细记录了一家科技公司私有化部署RAG知识库的全过程:基于JVS-AI开源套件,集成Llama 3 8B模型和Chroma向量数据库,实现了2000份文档的智能问答,准确率达85%,响应时间控制在2-3秒。文章涵盖架构设计、部署步骤、性能调优、权限隔离及常见问题解决方案,为有类似需求的企业提供可直接参考的技术实践。
逻极4 天前
llm·agent·react·rag·多智能体系统
Hermes Agent深度解析:从ReAct到多智能体系统架构实战核心观点: Agent不是简单的API调用,而是一个能感知、思考、行动和适应的自主系统。在人工智能的浪潮中,大型语言模型(LLMs)的出现无疑是划时代的事件。它们赋予了机器前所未有的自然语言理解和生成能力。然而,如果将 LLMs 视为强大的“大脑”,那么如何让这个大脑真正具备“行动力”、“记忆力”和“规划能力”,从而解决现实世界复杂的、多步骤的问题,则是当前 AI 领域的核心挑战。