rag

guslegend5 小时前
人工智能·大模型·rag
第5节:动态切片策略与重叠机制提升RAG召回率RAG与Agent性能调优:5.动态切片策略与重叠机制提升RAG召回率Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
Devin~Y5 小时前
java·spring boot·redis·elasticsearch·spring cloud·kafka·rag
高并发电商与AI智能客服场景下的Java面试实战:从Spring Boot到RAG与向量数据库落地场景:某头部互联网大厂,核心业务为电商 + 智能客服 + 广告推荐。角色:面试岗位:Java 后端工程师,主要做电商订单 + 用户画像 + AI 智能客服 / RAG 问答机器人相关的业务。
QC·Rex10 小时前
spring boot·大模型·向量数据库·rag·spring ai·tool calling
Spring Boot + Spring AI 实战:从零构建企业级 AI 应用随着大模型技术的快速发展,AI 应用开发已经从 Python 专属扩展到多语言生态。Spring AI 作为 Spring 官方推出的 AI 工程化框架,让 Java 开发者能够以熟悉的 Spring 编程模型快速构建企业级 AI 应用。本文将从零开始,详细介绍如何使用 Spring Boot 3.5 和 Spring AI 1.0 构建一个完整的 AI 应用,涵盖 ChatClient API、Tool Calling、RAG 检索增强、向量数据库集成等核心功能。通过本文,你将掌握 Spring AI
guslegend11 小时前
人工智能·大模型·rag
第4节:切片语义割裂怎么办?RAG与Agent性能调优:4.切片语义割裂怎么办?Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
sun_tao12 天前
人工智能·rag·ragas·rag评估
如何评估RAG系统的效果RAG(Retrieval-Augmented Generation)系统由 检索(Retrieval) + 生成(Generation) 两个核心模块组成,评估需分层进行,不能只看最终答案。
minhuan2 天前
rag·ai智能体·大模型应用·skill应用·rag+skill结合
轻量级RAG与SKILL架构深度融合:专属知识库驱动智能体精准知识匹配应用实践.138我们在做大模型落地时基本都有共识:光靠大模型本身很容易出现幻觉,回答不严谨、业务知识对不上,所以RAG检索增强生成几乎成了标配。但真正用起来同样会发现,传统RAG更像一个大一统知识库,把所有业务资料、文档、规则全都塞进一个向量库里,看似全面,实则问题一堆。知识多了之后检索混乱,客服话术和技术方案互相干扰,检索精度下降;更新一条业务规则就要重构整个库,维护成本极高;而且知识库和智能体能力绑死在一起,想加个新功能、改个问答逻辑都牵一发动全身。
laufing3 天前
langchain·embedding·rag
RAG 基础版 -- 基于langchain框架基于langchain 0.3.28 构建RAGpending
凤山老林4 天前
java·人工智能·知识库·rag·spring ai
Java 开发者零成本构建 RAG 知识库:Spring AI Alibaba + Ollama 搭建本地 RAG 知识库大模型再聪明,也不了解你的公司内部文档。RAG 就是让通用模型学会"你的知识"的最佳方案。假设你是一家公司的技术负责人,团队积累了大量内部文档——产品手册、运维手册、技术规范、FAQ。现在你想做一个智能问答系统,让员工可以用自然语言提问。
guslegend4 天前
人工智能·大模型·rag
4月6日(RAG系统)使用二进制量化技术,使RAG的内存效率提高32倍我们使用LlamaIndex的目录读取工具来导入文档。该工具能够读取多种数据格式
Flying pigs~~4 天前
自然语言处理·大模型·agent·多模态·rag·prompt提示词
多模态RAG实战:从表格到音视频的全链路落地指南多模态处理 = 对文本、表格、图片、音频、视频等不同模式的数据,分别用最优方案处理,最终融合得到结果的过程。
Devin~Y4 天前
java·spring boot·redis·spring cloud·kafka·向量数据库·rag
高并发内容社区实战面试:从 Java 基础到 Spring Cloud、Kafka、Redis、RAG 搜索全解析场景:互联网大厂 Java 岗现场面试,业务是“高并发内容社区 + AI 搜索推荐”。 角色:背景:公司做一个类似「内容社区 + UGC + AIGC」的平台,用户可以发视频、图文,AI 自动生成摘要和标题,并支持点赞、评论、收藏。第一轮先从单体应用与基本 Web 能力问起。
加油20194 天前
ai·知识库·rag
软件工程师知识库搭建本文介绍一些个人工作中的搭建一些知识库,经常需要查询内容都适合做成知识库,利用RAG技术实现全文搜索和智能匹配,知识库软件可以使用notion或者腾讯的ima工具。
Thomas.Sir4 天前
python·ai·rag·graphrag
第十三章:RAG知识库开发之【GraphRAG 从基础到实战】随着大语言模型(LLM)的快速发展,检索增强生成(RAG)已成为解决模型“幻觉”、引入外部知识的核心技术,广泛应用于智能问答、知识库构建、智能运维等场景。传统基于向量的 RAG(Vector RAG)虽能实现语义检索,但存在知识碎片化、缺乏逻辑关联、多跳推理能力弱等痛点,难以满足复杂场景下的精准检索与推理需求。
Chef_Chen4 天前
agent·rag
Agent学习--RAG--BM25+倒排索引在上一篇RAG文章中,我们回顾了RAG的核心思想,主要是分块策略以及检索中关于向量数据库的匹配规则。 现在我们来重点回顾一下检索的BM25和倒排索引
sun_tao15 天前
rag·rerank·hyde
生产级的复杂RAG系统流程复杂RAG的索引阶段需要比基础RAG考虑得更周全。文档加载与智能分块加载:使用Unstructured、LlamaIndex等工具解析PDF、Word等格式。
ZGi.ai5 天前
人工智能·rag·大模型落地·企业ai·ai底座
企业AI的运行底座是什么?和AI工具有什么本质区别?2026年,企业采购AI工具已经不是新闻。但一个普遍存在的现象是:工具买了一大堆,业务效率却没有明显提升。
XLYcmy5 天前
python·网络安全·ai·llm·agent·rag·ai安全
一个针对医疗RAG系统的数据窃取攻击工具该程序的核心功能并非其表面所宣称的“精准医疗数据提取”,而是一个专门设计用于攻击医疗领域检索增强生成(RAG)系统,以窃取敏感患者医疗记录的攻击脚本。程序通过模拟一系列看似合理的、高权限的医疗数据查询请求,试图诱导或“欺骗”后端的RAG系统泄露其本不应公开的完整、结构化医疗数据。
YoanAILab6 天前
知识库·向量检索·rag·bm25·rerank
RAG 知识库检索参数怎么调?一篇讲清 top_k、BM25、Rerank、各种阈值的区别很多人在刚开始做知识库问答、Dify 工作流、RAG 系统时,最容易遇到的问题不是“模型不够强”,而是:
Thomas.Sir6 天前
人工智能·python·ai·rag·预检索·后检索
第十二章:RAG知识库开发之【RAG的预检索和后检索:核心优化策略与实践】随着大语言模型(LLM)的快速发展,检索增强生成(Retrieval-Augmented Generation, RAG)已成为连接海量知识库与生成模型的核心技术,广泛应用于智能问答、文档助手、知识库检索等场景。RAG的核心逻辑是“检索+生成”,通过先从知识库中检索与用户查询相关的信息,再将检索结果作为上下文输入LLM,从而生成准确、有依据、不编造的回复。但在实际应用中,基础RAG常常面临检索效率低、相关性不足、生成内容冗余等问题,而预检索与后检索的优化的是解决这些问题的关键。