rag

deephub14 小时前
人工智能·python·大语言模型·向量检索·rag
从检索到回答:RAG 流水线中三个被忽视的故障点RAG 流水线部署完毕、检索正常运行、LLM 按部就班地生成回答、用户也在持续收到响应,这一切看上去运转良好。但有一个问题大多数工程师从来不问:这些回答真的对吗?
Flying pigs~~19 小时前
数据库·redis·缓存·大模型·qa·rag·prompt提示词
RAG前身:基于mysql➕redis➕bm25的传统QA问答系统本文将从一个完整的项目实战出发,详细讲解如何构建一个基于传统检索技术的智能问答系统。我们会逐行分析代码,深入理解每个模块的设计思想、实现细节和优化思路。
念念不忘 必有回响19 小时前
rag·切分
RAG 入门第二课:从 PDF 深度解析到智能入库全链路在构建 RAG 系统时,我们常把精力花在调优大模型上,却忽略了最基础也最关键的一环——数据处理。俗话说“垃圾进,垃圾出”,如果文档读取乱码、切分支离破碎,再强大的模型也无法给出精准答案。
Flying pigs~~20 小时前
人工智能·agent·milvus·rag·智能体·检索增强生成
检索增强生成RAG项目tools_03:mysql➕redis➕milvus前面我们介绍了Docker部署➕ollama➕logging➕bm25等RAG项目中各个必不可少的tools,本篇主要讲的是mysql➕redis➕milvus!!!
guslegend20 小时前
人工智能·大模型·faiss·rag
第9节:FAISS,HNSW还是BM25?如何选择最适合业务的向量检索引擎?如何选择最适合业务的向量检索引擎RAG与Agent性能调优:第8节:打造可配置,可扩展的自动化预处理流水线Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
发光的叮当猫20 小时前
人工智能·微调·rag·ai工程
AI工程可能会遇到的一些问题1,检索质量太差,根本没有检索到正确内容原因:embedding不行,相似度算错,语义没对齐。query没有被改写,完全没有上下文,检索失败。
QC·Rex2 天前
向量数据库·rag·相似度搜索·hnsw 算法·ai 基础设施
向量数据库架构与应用实战:从原理到生产部署在传统的关系型数据库中,数据查询主要基于精确匹配或范围查询。例如:然而,在 AI 应用场景中,我们经常需要处理"语义相似性"查询:
deephub2 天前
人工智能·大语言模型·知识库·rag
Karpathy的LLM Wiki:一种将RAG从解释器模式升级为编译器模式的架构Andrej Karpathy在GitHub上发布了一份名为LLM Wiki的文档引起了巨大的关注,一派认为"这不就是多绕了几步的RAG",另一派已经打开编辑器着手搭建测试。
guslegend2 天前
人工智能·大模型·rag
第8节:打造可配置,可扩展的自动化预处理流水线RAG与Agent性能调优:第8节:打造可配置,可扩展的自动化预处理流水线Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
guslegend3 天前
人工智能·大模型·ocr·rag
第6节:OCR文本错漏频发?结合LLM纠错,让图像文本也能精确使用RAG与Agent性能调优:6.OCR文本错漏频发?结合LLM纠错,让图像文本也能精确使用Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
@atweiwei3 天前
开发语言·rust·langchain·agent·向量数据库·rag
langchainrust:Rust 版 LangChain 框架(LLM+Agent+RAG)langchainrust 是一个 Rust 实现的 LLM 应用框架,提供 LLM 调用、Agent、RAG、向量存储、回调追踪等功能。
小饕4 天前
人工智能·rag·大模型应用
RAG 学习之-向量数据库与 FAISS 索引完全指南:从原理到选型实战摘要:本文系统讲解向量数据库的核心知识,涵盖 FAISS 索引类型、参数调优、主流向量数据库对比,以及按业务场景的选型指南。无论你是想快速搭建 RAG 原型,还是规划企业级向量检索系统,都能在这里找到答案。
handsomestWei4 天前
人工智能·知识图谱·rag·lightrag
LightRAG知识图谱使用和工作流集成全文链接:LightRAG知识图谱使用和工作流集成LightRAG,知识图谱,简单且快速的检索增强生成(RAG)框架。
handsomestWei4 天前
人工智能·知识图谱·rag·lightrag
RAG知识图谱简介全文链接:RAG知识图谱简介知识图谱(Knowledge Graph) 是一种以图结构表示知识的方法,通过实体(Entity)- 关系(Relation)- 属性(Attribute) 三元组形式,将现实世界的对象及其关联关系进行结构化建模。
guslegend4 天前
人工智能·大模型·rag
第5节:动态切片策略与重叠机制提升RAG召回率RAG与Agent性能调优:5.动态切片策略与重叠机制提升RAG召回率Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
Devin~Y4 天前
java·spring boot·redis·elasticsearch·spring cloud·kafka·rag
高并发电商与AI智能客服场景下的Java面试实战:从Spring Boot到RAG与向量数据库落地场景:某头部互联网大厂,核心业务为电商 + 智能客服 + 广告推荐。角色:面试岗位:Java 后端工程师,主要做电商订单 + 用户画像 + AI 智能客服 / RAG 问答机器人相关的业务。
QC·Rex4 天前
spring boot·大模型·向量数据库·rag·spring ai·tool calling
Spring Boot + Spring AI 实战:从零构建企业级 AI 应用随着大模型技术的快速发展,AI 应用开发已经从 Python 专属扩展到多语言生态。Spring AI 作为 Spring 官方推出的 AI 工程化框架,让 Java 开发者能够以熟悉的 Spring 编程模型快速构建企业级 AI 应用。本文将从零开始,详细介绍如何使用 Spring Boot 3.5 和 Spring AI 1.0 构建一个完整的 AI 应用,涵盖 ChatClient API、Tool Calling、RAG 检索增强、向量数据库集成等核心功能。通过本文,你将掌握 Spring AI
guslegend5 天前
人工智能·大模型·rag
第4节:切片语义割裂怎么办?RAG与Agent性能调优:4.切片语义割裂怎么办?Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
sun_tao16 天前
人工智能·rag·ragas·rag评估
如何评估RAG系统的效果RAG(Retrieval-Augmented Generation)系统由 检索(Retrieval) + 生成(Generation) 两个核心模块组成,评估需分层进行,不能只看最终答案。
minhuan6 天前
rag·ai智能体·大模型应用·skill应用·rag+skill结合
轻量级RAG与SKILL架构深度融合:专属知识库驱动智能体精准知识匹配应用实践.138我们在做大模型落地时基本都有共识:光靠大模型本身很容易出现幻觉,回答不严谨、业务知识对不上,所以RAG检索增强生成几乎成了标配。但真正用起来同样会发现,传统RAG更像一个大一统知识库,把所有业务资料、文档、规则全都塞进一个向量库里,看似全面,实则问题一堆。知识多了之后检索混乱,客服话术和技术方案互相干扰,检索精度下降;更新一条业务规则就要重构整个库,维护成本极高;而且知识库和智能体能力绑死在一起,想加个新功能、改个问答逻辑都牵一发动全身。