rag

minhuan4 小时前
rag·ai智能体·大模型应用·skill应用·rag+skill结合
轻量级RAG与SKILL架构深度融合:专属知识库驱动智能体精准知识匹配应用实践.138我们在做大模型落地时基本都有共识:光靠大模型本身很容易出现幻觉,回答不严谨、业务知识对不上,所以RAG检索增强生成几乎成了标配。但真正用起来同样会发现,传统RAG更像一个大一统知识库,把所有业务资料、文档、规则全都塞进一个向量库里,看似全面,实则问题一堆。知识多了之后检索混乱,客服话术和技术方案互相干扰,检索精度下降;更新一条业务规则就要重构整个库,维护成本极高;而且知识库和智能体能力绑死在一起,想加个新功能、改个问答逻辑都牵一发动全身。
laufing1 天前
langchain·embedding·rag
RAG 基础版 -- 基于langchain框架基于langchain 0.3.28 构建RAGpending
凤山老林1 天前
java·人工智能·知识库·rag·spring ai
Java 开发者零成本构建 RAG 知识库:Spring AI Alibaba + Ollama 搭建本地 RAG 知识库大模型再聪明,也不了解你的公司内部文档。RAG 就是让通用模型学会"你的知识"的最佳方案。假设你是一家公司的技术负责人,团队积累了大量内部文档——产品手册、运维手册、技术规范、FAQ。现在你想做一个智能问答系统,让员工可以用自然语言提问。
guslegend1 天前
人工智能·大模型·rag
4月6日(RAG系统)使用二进制量化技术,使RAG的内存效率提高32倍我们使用LlamaIndex的目录读取工具来导入文档。该工具能够读取多种数据格式
Flying pigs~~2 天前
自然语言处理·大模型·agent·多模态·rag·prompt提示词
多模态RAG实战:从表格到音视频的全链路落地指南多模态处理 = 对文本、表格、图片、音频、视频等不同模式的数据,分别用最优方案处理,最终融合得到结果的过程。
Devin~Y2 天前
java·spring boot·redis·spring cloud·kafka·向量数据库·rag
高并发内容社区实战面试:从 Java 基础到 Spring Cloud、Kafka、Redis、RAG 搜索全解析场景:互联网大厂 Java 岗现场面试,业务是“高并发内容社区 + AI 搜索推荐”。 角色:背景:公司做一个类似「内容社区 + UGC + AIGC」的平台,用户可以发视频、图文,AI 自动生成摘要和标题,并支持点赞、评论、收藏。第一轮先从单体应用与基本 Web 能力问起。
加油20192 天前
ai·知识库·rag
软件工程师知识库搭建本文介绍一些个人工作中的搭建一些知识库,经常需要查询内容都适合做成知识库,利用RAG技术实现全文搜索和智能匹配,知识库软件可以使用notion或者腾讯的ima工具。
Thomas.Sir2 天前
python·ai·rag·graphrag
第十三章:RAG知识库开发之【GraphRAG 从基础到实战】随着大语言模型(LLM)的快速发展,检索增强生成(RAG)已成为解决模型“幻觉”、引入外部知识的核心技术,广泛应用于智能问答、知识库构建、智能运维等场景。传统基于向量的 RAG(Vector RAG)虽能实现语义检索,但存在知识碎片化、缺乏逻辑关联、多跳推理能力弱等痛点,难以满足复杂场景下的精准检索与推理需求。
Chef_Chen2 天前
agent·rag
Agent学习--RAG--BM25+倒排索引在上一篇RAG文章中,我们回顾了RAG的核心思想,主要是分块策略以及检索中关于向量数据库的匹配规则。 现在我们来重点回顾一下检索的BM25和倒排索引
sun_tao13 天前
rag·rerank·hyde
生产级的复杂RAG系统流程复杂RAG的索引阶段需要比基础RAG考虑得更周全。文档加载与智能分块加载:使用Unstructured、LlamaIndex等工具解析PDF、Word等格式。
ZGi.ai3 天前
人工智能·rag·大模型落地·企业ai·ai底座
企业AI的运行底座是什么?和AI工具有什么本质区别?2026年,企业采购AI工具已经不是新闻。但一个普遍存在的现象是:工具买了一大堆,业务效率却没有明显提升。
XLYcmy3 天前
python·网络安全·ai·llm·agent·rag·ai安全
一个针对医疗RAG系统的数据窃取攻击工具该程序的核心功能并非其表面所宣称的“精准医疗数据提取”,而是一个专门设计用于攻击医疗领域检索增强生成(RAG)系统,以窃取敏感患者医疗记录的攻击脚本。程序通过模拟一系列看似合理的、高权限的医疗数据查询请求,试图诱导或“欺骗”后端的RAG系统泄露其本不应公开的完整、结构化医疗数据。
YoanAILab3 天前
知识库·向量检索·rag·bm25·rerank
RAG 知识库检索参数怎么调?一篇讲清 top_k、BM25、Rerank、各种阈值的区别很多人在刚开始做知识库问答、Dify 工作流、RAG 系统时,最容易遇到的问题不是“模型不够强”,而是:
Thomas.Sir4 天前
人工智能·python·ai·rag·预检索·后检索
第十二章:RAG知识库开发之【RAG的预检索和后检索:核心优化策略与实践】随着大语言模型(LLM)的快速发展,检索增强生成(Retrieval-Augmented Generation, RAG)已成为连接海量知识库与生成模型的核心技术,广泛应用于智能问答、文档助手、知识库检索等场景。RAG的核心逻辑是“检索+生成”,通过先从知识库中检索与用户查询相关的信息,再将检索结果作为上下文输入LLM,从而生成准确、有依据、不编造的回复。但在实际应用中,基础RAG常常面临检索效率低、相关性不足、生成内容冗余等问题,而预检索与后检索的优化的是解决这些问题的关键。
YoanAILab4 天前
人工智能·cot·dify·rag·deepresearch
从 CoT、RAG 到 Dify、Deep Research:一篇讲清 AI 问答系统的两条进化路线很多人在接触大模型应用时,经常会看到这些词:但问题是:这些词到底是什么关系?CoT(提示词思想) + RAG(检索增强)
weixin_492722824 天前
rag
RAG 已死,Baklib 才是未来传统的 RAG 平台是为 AI 提供阅读资料;而 Baklib 是为企业构建一个 AI 深度参与、结构化管理、且能直接驱动终端业务体验的知识操作系统。
Chef_Chen4 天前
学习·rag
Agent学习--RAG(1)最近经过了一段时间的学习,察觉到自己本身对于RAG的掌控还只停留在运用,但还不太懂其中的底层逻辑,换言之,就跟我们平时用智能体平台一样,使用者只需要将文件上传,就会看到有分块的设置选项,知识库节点会显示用的是倒排索引、重排等方法,虽然这看起来不会影响使用,但是从长远来看却是会降低使用的效率。
麦哲思科技任甲林5 天前
大模型·rag·anythingllm·本地知识库
四个软件三个步骤搭建本地知识库每家企业都有自己的很多历史资料,这些数据包含了大量的信息在里面,都是公司的财富,这些财富要想发挥作用,就要被引用,否则就是放在仓库里落灰发霉。想象一下,你有一堆宝贵的文档——技术手册、读书笔记、项目资料——每次想找个信息都要翻半天。如果能有一个AI助手,基于这些文档精准回答你的问题,那该多好?
deephub5 天前
人工智能·大语言模型·embedding·rag
多 Aspect Embedding:将上下文信号编入向量相似性计算的检索架构向量数据库的核心任务是对文本或其他非结构化数据生成的 Embedding 做相似性搜索。时间戳、文档类型、所有权一类的上下文约束,一般以外部过滤器的形式在向量搜索前后进行。多数场景下这一架构运作正常,但当上下文信号需要参与排序就会有问题。本文分析传统向量数据库架构的过滤与检索机制,并介绍 Aspected 的 Aspect Database:一个面向 AI 系统的上下文感知检索引擎,将上下文属性经由多 Aspect Embedding 直接编码进相似性计算所用的表示中。