rag

深色風信子18 分钟前
rag·springai·springai rag
SpringAI Rag 文件读取
Haooog19 小时前
java·大模型·项目·rag
RAG医疗问答系统在当今科技飞速发展的时代,人工智能(AI)已经成为各行各业不可或缺的一部分。特别是在文档处理和数据分析领域,AI的应用更是无处不在。今天,我要向大家介绍一个开源的AI框架引擎——RAGflow。它能够在深度文档理解方面执行检索增强生成(Retrieval-Augmented Generation,简称RAG),并且被认为是目前最优秀的RAG框架之一。本文将详细探讨RAGflow的创新功能、技术特点以及如何在实际应用中发挥其最大潜力。
一个无名的炼丹师2 天前
人工智能·python·rag
GraphRAG深度解析:从原理到实战,重塑RAG检索增强生成的未来摘要 在大语言模型(LLM)从“玩具”走向“工具”的商业化落地进程中,如何让模型“懂”私有数据是核心命题。传统的检索增强生成(Native RAG)通过向量相似度检索解决了部分问题,但在面对全库归纳、多跳推理及复杂逻辑关联时常常显得力不从心。 微软研究院于2024年重磅推出的 GraphRAG,通过结合知识图谱(Knowledge Graph)与大模型,将非结构化文本转化为结构化知识网络,彻底改变了RAG的检索范式。 本文将以万字篇幅,从RAG的发展瓶颈出发,手把手带你进行GraphRAG与NativeR
FranzLiszt18472 天前
langchain·fastgpt·rag·ollama·one api
基于One API 将本地 Ollama 模型接入 FastGPTOllama:https://ollama.com/在Ollama选择好大模型后可以在terminal运行。例如我们选择deepseek-r1:1.5b,则使用ollama run deepseek-r1:1.5b运行并下载至本地,在终端就会出现与网页大模型交互一样的问答。
石去皿2 天前
c++·python·大模型·rag
从本地知识库到“活”知识——RAG 落地全景指南把 LLM 当“大脑”,把 RAG 当“外接硬盘”,让模型既能说人话,又能说“内行话”。全程本地跑,数据不出内网,句号。
小小工匠2 天前
agent·rag·skill·mcp
LLM - 从通用对话到自治智能体:Agent / Skills / MCP / RAG 三层架构实战在大模型从“能聊天”的通用工具,演进到“能负责结果”的专业自治系统的过程中,一个越来越清晰的共识是:光有一个强大的 LLM 远远不够,需要一整套围绕 Agent、Skills、MCP、RAG 构建的系统化架构。
沛沛老爹3 天前
java·人工智能·llm·llama·rag·agent skills
Web开发者5分钟上手:Agent Skills环境搭建与基础使用实战图片来源网络,侵权联系删。作为Web开发者,我们早已习惯npm install、docker-compose up这类环境配置命令。当面对AI开发时,环境配置的复杂性往往是转型最大障碍——Python版本冲突、CUDA驱动缺失、模型文件庞大等问题,让无数前端工程师望而却步。而Agent Skills的出现,正是为了解决这一痛点:它将AI能力封装为标准模块,让环境搭建回归Web开发者熟悉的工程化体验。
沛沛老爹3 天前
java·人工智能·交互·rag·企业开发·web转型ai
深入理解Agent Skills——AI助手的“专业工具箱“实战入门图片来源网络,侵权联系删。在Web开发中,我们习惯将复杂系统拆解为独立模块——用户认证、支付网关、日志服务各司其职。这种模块化思想正是Agent Skills体系的核心基因。当Web开发者转向AI应用开发时,最大的认知鸿沟往往在于:如何将熟悉的工程化思维迁移到AI领域?
laplace01233 天前
笔记·python·中间件·langchain·rag
Part3 RAG文档切分这份 Notebook 的主线是:RAG 系统里“文档切分(chunking)”怎么做得更好。它强调切分不是“随便按长度分块”,而是一个工程化的端到端流程:
一代明君Kevin学长4 天前
自然语言处理·大语言模型·检索增强·文本处理·rag
RAG如何解决长文档chunking的信息丢失问题?常用的解决信息丢失的方式包括:延迟切分(Late Chunking)、代理切分(Agentic Chunking)等。 在构建检索增强生成(Retrieval-Augmented Generation, RAG)系统时,文本分块(Chunking)是决定系统性能的关键步骤。
deephub4 天前
人工智能·大语言模型·rag·langgraph
Agentic RAG:用LangGraph打造会自动修正检索错误的 RAG 系统标准 RAG 流水线有个根本性的毛病:检索到的文档一旦与用户意图对不上号,模型照样能面不改色地输出一堆看似合理的胡话,既没有反馈机制也谈不上什么纠错能力。
zs宝来了4 天前
spring boot·redis·微服务·大厂面试·java面试·rag·spring ai
大厂面试实录:Spring Boot源码深度解析+Redis缓存架构+RAG智能检索,谢飞机的AI电商面试之旅又是一年招聘季,某知名电商平台正在招聘高级Java开发工程师。谢飞机,一名自称"全栈工程师"的程序员,今天来到了面试现场。面试官是一位技术深厚的架构师,让我们来看看这场面试会发生什么有趣的故事...
laplace01234 天前
笔记·语言模型·langchain·rag
Part2.大模型RAG进阶多格式文档解析核心目标:把“多格式文档解析”这件事做到能落地的RAG数据入口,并给出一条从“解析 → 清洗/结构化 → 索引 → 检索问答”的实践路径。
laplace01234 天前
笔记·语言模型·langchain·rag
Part 1. 大模型RAG入门基础架构介绍课件先强调:通用大模型很难直接满足真实业务,主要痛点包括:知识可能过时(训练数据有时效性) 模型训练完成后,新发生的事实/政策/产品变更不会被模型“自动学会”,导致回答不及时。
沛沛老爹5 天前
java·人工智能·llm·llama·rag
用 Web 开发思维理解 Agent 的三大支柱——Tools + Memory + LLM图片来源网络,侵权联系删。如果你是一名 Web 开发者,你一定熟悉这样的场景:用户在前端填写表单 → 后端调用数据库查询用户信息 → 调用支付网关 → 发送邮件通知 → 返回成功页面
沛沛老爹5 天前
java·人工智能·llm·llama·rag·web转型
Web开发者深度解析Function Calling:Fc全链路机制与实战原理解析图片来源网络,侵权联系删。在 Web 开发中,我们早已习惯通过 RESTful API 调用后端服务:前端发送 GET /api/orders,后端返回 JSON 数据。这一过程清晰、可控、可调试。
Elwin Wong5 天前
人工智能·大模型·llm·rag·graphrag
GraphRAG简介最近因为团队有 GraphRAG 的需求,一直在调研这方面相关的工作。其实很早就了解以及折腾过这个领域中的鼻祖:微软的GraphRAG,至今依然很经典,但是当时也是浅尝辄止,没有好好深入了解。这次也是想借此机会好好整理下 GraphRAG 的技术内容,温故而知新,并且研究一些这方面做得比较好的开源项目,了解下目前这块的进展,后续慢慢更新。
沛沛老爹5 天前
java·人工智能·交互·rag·企业开发·发展趋势·web转型ai
Web开发者快速上手AI Agent:基于Function Calling的多步交互提示词优化实战Web开发者快速上手AI Agent:基于Function Calling的多步交互提示词优化实战图片来源网络,侵权联系删。
威风的虫5 天前
人工智能·python·rag
RAG 系统的经典工作流程RAG 的核心思路其实很简单:先检索,再生成。整个流程可以分为两大阶段 ——离线构建知识库和在线问答推理,每个阶段又包含几个关键步骤。
大鹏的NLP博客6 天前
rag
深度解析:RAG(检索增强生成)从提问到回答的通用工程逻辑在生成式 AI 落地应用中,RAG(Retrieval-Augmented Generation)已成为解决大模型“幻觉”、知识滞后及缺乏私域数据支撑的核心方案。