rag

示申○言舌5 小时前
游戏·unity·大模型·知识库·rag·智能npc·npc记忆
基于知识库(RAG)系统打造由大模型(LLM)驱动NPC游戏的技术设想最近一段时间有了一个想法——让大模型来驱动游戏里的NPC,让NPC活过来。这个点子并不是我首创,但是目前真正应用到实际游戏的,好像还真不多。我本以为不复杂,没想到随着研究的深入,复杂度已经超出了我的预期,这也解释了为什么,目前该技术没有大量应用到实际游戏了。
Lw中6 小时前
pdf·rag·大模型应用基础·多源文档处理
从PDF到RAG知识库在构建RAG(检索增强生成)系统的过程中,文档预处理是决定检索质量的基础环节。然而,面对多源异构文档(如PDF、图片、扫描件),手动处理不仅效率低下,还难以保证一致性和可维护性。为此,我们需要构建一条自动化预处理流水线,将OCR识别、文本清洗、分段、元数据绑定、知识库上传等步骤串联起来,并具备可配置和可扩展的能力,从而适应不同业务场景和未来需求的变化。
Lw中6 小时前
rag·多源文档处理
RAG如何统一多源文档格式?在构建检索增强生成(RAG)系统时,我们往往首先关注检索算法、嵌入模型或大语言模型的选择。然而,一个常被忽视却至关重要的环节是文档入口的处理——即如何将不同格式的源文档(如Word、PDF、图片、Excel等)统一解析为机器可读、结构清晰的文本内容。文档解析的质量直接决定了后续索引和检索的上限。本文将深入探讨多源文档格式的统一解析策略,并以Dify框架为例,展示Word和PDF解析的实战细节。
想摆烂的不会研究的研究生6 小时前
人工智能·agent·rag
RAG入门指南:检索增强生成全解析RAG=先查资料,再让大模型回答。他的英文全称是Retrieval-Augmented Generation,中文一般叫:检索增强生成。
大傻^1 天前
embedding·rag·长期记忆·上下文管理·openclaw·记忆架构
【OpenClaw -07】OpenClaw 记忆系统:三层记忆架构与 Daily Notes 机制标签:OpenClaw、记忆架构、RAG、Embedding、上下文管理、长期记忆在构建生产级 AI Agent 时,一个常被低估的架构难题是状态持久化。无状态的 LLM 调用虽然简单,但无法形成累积性的用户理解;而粗暴的全量历史拼接又很快会触达 Token 上限。OpenClaw 的记忆系统通过分层存储架构与智能归档机制,在上下文窗口限制与长期记忆能力之间建立了工程化的平衡。 本文将从架构实现角度,拆解 OpenClaw 的三层记忆模型、Daily Notes 持久化机制、语义检索配置策略以及多会话隔离
FeelTouch Labs1 天前
人工智能·rag·kohakurag
KohakuRAG:层次化RAG的新范式检索增强生成(RAG)已成为解决大模型幻觉和知识时效性的标准方案,但在高精度引用场景中,传统RAG面临三重挑战:
人道领域1 天前
人工智能·llm·rag·大模型微调
《别再纠结了!2026年终极指南:RAG(检索增强生成)、微调与长上下文,到底该选谁?》大家好,我是北极的代码。最近在后台收到很多粉丝私信:“我想做私有知识问答,到底是该用RAG,还是应该微调一个模型?”“现在大模型上下文窗口都1M了,是不是RAG要凉了?”
xier_ran2 天前
人工智能·语言模型·自然语言处理·agent·rag
【第一周】论文精读:Lost in the Middle: How Language Models Use Long Contexts前言:随着大语言模型(LLM)上下文窗口的不断扩展(从 4K 到 100K 甚至更长),一个关键问题随之浮现:模型真的能有效利用这么长的上下文吗? 斯坦福大学与 Samaya AI 合作的这篇论文《Lost in the Middle》给出了一个令人警醒的答案:不能。研究发现,当关键信息位于长上下文的中间部分时,模型的性能会显著下降,呈现出明显的“U型”曲线。这一发现被称为“中间迷失(Lost in the Middle)”现象,它揭示了当前长上下文模型在信息检索和利用上的巨大缺陷,对 RAG(检索增强生
Joy T2 天前
人工智能·agent·dify·rag·coze·openclaw
【AI Agent入门】从RAG知识库到智能体架构:实质区分Coze、Dify与OpenClaw在人工智能技术的演进历程中,我们正在经历一次重要的范式转换。大语言模型的使用方式正逐步从单一的文本对话,向具备自主执行能力的智能体(AI Agent)跨越。本文将结合系统性的架构图与主流零代码平台的实战界面,带大家全面梳理智能体的核心逻辑、RAG知识库的运转机制,以及如何在 Coze 和 Dify 这类现代平台上搭建专属的智能助手。
小马_xiaoen2 天前
人工智能·ai·rag·检索增强生成
RAG(检索增强生成)从原理到实战全解析导读:你是否遇到过这样的尴尬:问大模型一个公司内部的具体制度,它却胡编乱造?问它昨天的新闻,它却说“我的知识只更新到2023年”?这就是大模型的**“幻觉”和“知识滞后”**痛点。
千桐科技3 天前
大模型·知识图谱·知识库·工作流·rag·qknow·知识融合
qKnow 知识平台商业版v2.6.2 更新说明:重构图谱知识融合逻辑,上线 AI 工作流配置中心本次 v2.6.2 版本更新,是在 v2.6.1 实现大模型自主深度集成的基础上进行的迭代。本次更新的核心目标聚焦于三点:核心业务逻辑的严谨性、用户体验的精细化以及系统配置的低代码化。
Ray Liang6 天前
人工智能·rag·智能体·ai助手·mindx
彻底治愈AI“失忆”和胡说八道的真正办法这几天我一直在用我在《AI基于Spec开发是巨坑?》 所说的方法来继续MindX2的开发。虽然,在用前文中所提到的方法尽量去抑制AI胡说八道,但感觉还是治标不治本。AI总是时不时就开始任性独断,顺口胡诌。
deephub16 天前
人工智能·python·rag·检索
向量搜索系统的三个核心优化维度:速度、精度与规模当数据集膨胀到数百万甚至数十亿量级的向量时,怎么让搜索在这种规模下依然又快又准就成了一个实实在在的工程难题。这篇文章要聊的就是向量搜索系统的三个核心优化方向——性能调优、混合搜索和可扩展架构。
海棠AI实验室16 天前
架构·copilot·rag
RAG 五大应用场景(三)企业级 Code RAG 与代码库 Copilot 深度架构指南摘要:在构建企业级代码库 Copilot 的道路上,无数团队在 Code RAG(Retrieval-Augmented Generation for Code)的“第一跪”,往往不是因为大模型智商不够,而是因为底层的“切分与检索方式”从一开始就走错了方向。本文由浅入深,从底层抽象、数学建模、算法设计到工程架构,带你完成从“字符串暴力切分”到“AST 语法树结构化图检索”的认知飞跃与技术重构。
海棠AI实验室16 天前
rag·法务合同合规系统
RAG 五大应用场景(四)法务合同合规系统 —— 从“聊天玩具”到“证据链引擎”导语:在通用大模型的语境下,AI产生的“幻觉”(Hallucination)或许只是社交媒体上博人一笑的段子;但在法律合规领域,幻觉就是一场实打实的“官司”,是足以毁掉职业生涯的定时炸弹。本文将从高级架构师与算法工程师的视角,深度拆解法务大模型落地的底层逻辑:为什么法务场景的终局不是“更聪明的Chatbot”,而是“可溯源的证据链引擎”?
deephub17 天前
人工智能·大语言模型·rag·检索
RAG 中分块重叠的 8 个隐性开销与权衡策略RAG 分块重叠提升了召回率但增加了隐藏成本,比如说索引膨胀、Embedding 开销、延迟、重排序负载和评估漂移。
无聊的小坏坏17 天前
langchain·rag·大模型应用
RAG 实战 (下):打造多轮对话知识助手核心痛点:简单的 RAG 只能回答单次提问。如何让 AI 记住上下文(解决代词指代),并告诉我们要查找的答案出自哪篇文档?
无聊的小坏坏18 天前
langchain·rag·大模型应用
RAG 实战 (上):构建向量知识库核心痛点:大模型没有“私有数据”。如何让它读取我的 PDF、Markdown 文档甚至网页?本篇将带你走通 RAG 的前 80% 流程:ETL(加载、切分、嵌入、存储)。
麦麦大数据19 天前
typescript·langchain·flask·vue3·faiss·rag
M004_基于Langchain+RAG的银行智能客服系统设计与开发欢迎关注B站:麦麦大数据 https://space.bilibili.com/1583208775随着金融科技的快速发展,银行客户服务面临着前所未有的挑战。传统的人工客服存在响应慢、成本高、服务时间受限等问题。为了提升客户服务体验,本文将介绍一款基于**LangChain + RAG(检索增强生成)**技术构建的银行智能客服系统。