rag

TTGGGFF2 小时前
rag·重排序
什么是RAG重排序? 3 分钟落地最强轻量级重排序模型 BGE-Reranker-v2-m3在构建 RAG(检索增强生成)系统时,很多人会发现:即便用了向量数据库,检索回来的前几个文档依然可能“牛头不对马嘴”。这是因为向量搜索(粗排)侧重于语义空间的距离,而 Reranker(精排) 能够深度分析查询句与文档句之间的细微逻辑关系。
学Linux的语莫2 小时前
langchain·rag
Rag操作-Ragas评估ContextPrecision(上下文精确度)1.检索器返回大量无关文档2.向量数据库索引策略有误、相关文档排名低等。
阿里巴巴P8资深技术专家2 小时前
ai·ocr·ai大模型·rag·文档解析·mineru·tike
Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈
AI架构师易筋1 天前
开发语言·人工智能·llm·aiops·rag
AIOps 告警归因中的提示工程:从能用到可上生产(4 阶梯)适用对象:做生产运维 / SRE / 平台工程 / ITSM 流程治理的团队,想把 LLM 用在 告警归因(Root Cause Analysis, RCA) 上,并且做到“可控、可复用、可评测”。
深色風信子1 天前
rag·springai·springai rag
SpringAI Rag 文件读取
Haooog2 天前
java·大模型·项目·rag
RAG医疗问答系统在当今科技飞速发展的时代,人工智能(AI)已经成为各行各业不可或缺的一部分。特别是在文档处理和数据分析领域,AI的应用更是无处不在。今天,我要向大家介绍一个开源的AI框架引擎——RAGflow。它能够在深度文档理解方面执行检索增强生成(Retrieval-Augmented Generation,简称RAG),并且被认为是目前最优秀的RAG框架之一。本文将详细探讨RAGflow的创新功能、技术特点以及如何在实际应用中发挥其最大潜力。
一个无名的炼丹师3 天前
人工智能·python·rag
GraphRAG深度解析:从原理到实战,重塑RAG检索增强生成的未来摘要 在大语言模型(LLM)从“玩具”走向“工具”的商业化落地进程中,如何让模型“懂”私有数据是核心命题。传统的检索增强生成(Native RAG)通过向量相似度检索解决了部分问题,但在面对全库归纳、多跳推理及复杂逻辑关联时常常显得力不从心。 微软研究院于2024年重磅推出的 GraphRAG,通过结合知识图谱(Knowledge Graph)与大模型,将非结构化文本转化为结构化知识网络,彻底改变了RAG的检索范式。 本文将以万字篇幅,从RAG的发展瓶颈出发,手把手带你进行GraphRAG与NativeR
FranzLiszt18473 天前
langchain·fastgpt·rag·ollama·one api
基于One API 将本地 Ollama 模型接入 FastGPTOllama:https://ollama.com/在Ollama选择好大模型后可以在terminal运行。例如我们选择deepseek-r1:1.5b,则使用ollama run deepseek-r1:1.5b运行并下载至本地,在终端就会出现与网页大模型交互一样的问答。
石去皿3 天前
c++·python·大模型·rag
从本地知识库到“活”知识——RAG 落地全景指南把 LLM 当“大脑”,把 RAG 当“外接硬盘”,让模型既能说人话,又能说“内行话”。全程本地跑,数据不出内网,句号。
小小工匠3 天前
agent·rag·skill·mcp
LLM - 从通用对话到自治智能体:Agent / Skills / MCP / RAG 三层架构实战在大模型从“能聊天”的通用工具,演进到“能负责结果”的专业自治系统的过程中,一个越来越清晰的共识是:光有一个强大的 LLM 远远不够,需要一整套围绕 Agent、Skills、MCP、RAG 构建的系统化架构。
沛沛老爹4 天前
java·人工智能·llm·llama·rag·agent skills
Web开发者5分钟上手:Agent Skills环境搭建与基础使用实战图片来源网络,侵权联系删。作为Web开发者,我们早已习惯npm install、docker-compose up这类环境配置命令。当面对AI开发时,环境配置的复杂性往往是转型最大障碍——Python版本冲突、CUDA驱动缺失、模型文件庞大等问题,让无数前端工程师望而却步。而Agent Skills的出现,正是为了解决这一痛点:它将AI能力封装为标准模块,让环境搭建回归Web开发者熟悉的工程化体验。
沛沛老爹4 天前
java·人工智能·交互·rag·企业开发·web转型ai
深入理解Agent Skills——AI助手的“专业工具箱“实战入门图片来源网络,侵权联系删。在Web开发中,我们习惯将复杂系统拆解为独立模块——用户认证、支付网关、日志服务各司其职。这种模块化思想正是Agent Skills体系的核心基因。当Web开发者转向AI应用开发时,最大的认知鸿沟往往在于:如何将熟悉的工程化思维迁移到AI领域?
laplace01234 天前
笔记·python·中间件·langchain·rag
Part3 RAG文档切分这份 Notebook 的主线是:RAG 系统里“文档切分(chunking)”怎么做得更好。它强调切分不是“随便按长度分块”,而是一个工程化的端到端流程:
一代明君Kevin学长5 天前
自然语言处理·大语言模型·检索增强·文本处理·rag
RAG如何解决长文档chunking的信息丢失问题?常用的解决信息丢失的方式包括:延迟切分(Late Chunking)、代理切分(Agentic Chunking)等。 在构建检索增强生成(Retrieval-Augmented Generation, RAG)系统时,文本分块(Chunking)是决定系统性能的关键步骤。
deephub5 天前
人工智能·大语言模型·rag·langgraph
Agentic RAG:用LangGraph打造会自动修正检索错误的 RAG 系统标准 RAG 流水线有个根本性的毛病:检索到的文档一旦与用户意图对不上号,模型照样能面不改色地输出一堆看似合理的胡话,既没有反馈机制也谈不上什么纠错能力。
zs宝来了5 天前
spring boot·redis·微服务·大厂面试·java面试·rag·spring ai
大厂面试实录:Spring Boot源码深度解析+Redis缓存架构+RAG智能检索,谢飞机的AI电商面试之旅又是一年招聘季,某知名电商平台正在招聘高级Java开发工程师。谢飞机,一名自称"全栈工程师"的程序员,今天来到了面试现场。面试官是一位技术深厚的架构师,让我们来看看这场面试会发生什么有趣的故事...
laplace01235 天前
笔记·语言模型·langchain·rag
Part2.大模型RAG进阶多格式文档解析核心目标:把“多格式文档解析”这件事做到能落地的RAG数据入口,并给出一条从“解析 → 清洗/结构化 → 索引 → 检索问答”的实践路径。
laplace01235 天前
笔记·语言模型·langchain·rag
Part 1. 大模型RAG入门基础架构介绍课件先强调:通用大模型很难直接满足真实业务,主要痛点包括:知识可能过时(训练数据有时效性) 模型训练完成后,新发生的事实/政策/产品变更不会被模型“自动学会”,导致回答不及时。
沛沛老爹6 天前
java·人工智能·llm·llama·rag
用 Web 开发思维理解 Agent 的三大支柱——Tools + Memory + LLM图片来源网络,侵权联系删。如果你是一名 Web 开发者,你一定熟悉这样的场景:用户在前端填写表单 → 后端调用数据库查询用户信息 → 调用支付网关 → 发送邮件通知 → 返回成功页面
沛沛老爹6 天前
java·人工智能·llm·llama·rag·web转型
Web开发者深度解析Function Calling:Fc全链路机制与实战原理解析图片来源网络,侵权联系删。在 Web 开发中,我们早已习惯通过 RESTful API 调用后端服务:前端发送 GET /api/orders,后端返回 JSON 数据。这一过程清晰、可控、可调试。