rag

北京地铁1号线1 小时前
数据库·rag
1.4 RAG中的Schema在计算机科学中,Schema(模式)指的是对数据结构、组织方式和约束条件的正式定义。在数据库领域,Schema定义了表的结构、字段类型、关系等。在文档处理中,Schema可以理解为对文档及其元数据结构的描述,它规定了哪些元数据字段是必需的,它们的类型、格式以及可能的取值范围。
deephub15 小时前
人工智能·机器学习·ai编程·rag·ai编程助手
构建自己的AI编程助手:基于RAG的上下文感知实现方案很多人觉得做个AI助手就是调调OpenAI的接口,其实这样智能做出一个通用聊天机器人。而代码助手需要专门为代码设计的上下文感知的RAG(Retrieval-Augmented Generation)管道,这是因为代码跟普通文本不一样,结构严格,而且不能随便按字符随便进行分割。
laplace012318 小时前
架构·大模型·llm·agent·rag
claude code架构猜测总结Claude Code 本质 =「LLM 驱动的 Tool-Calling 循环」+「逐层外置的认知结构」 模型是 Agent,本体代码只负责:约束、反馈、隔离、注入知识。
lkbhua莱克瓦2418 小时前
人工智能·llm·prompt·大语言模型·rag·rga
RAG到RGA:生成式AI的范式演进在深入探讨RGA之前,让我们先回顾一下它演进而来的基础框架——RAG(检索增强生成)。想象一位准备重要演讲的学者。传统大语言模型如同依赖固定记忆库的专家,只能基于训练时学到的知识回答问题,无法获取最新信息或特定领域资料。而RAG则像是为这位专家配备了实时研究助手:当问题提出时,助手先检索相关文献,然后将这些资料与问题一同交给专家,生成更准确、更具时效性的回答。
洛阳泰山20 小时前
java·agent·工作流·rag·智能体·maxkb
智能体项目MaxKB4J - 本地部署与开发完整指南项目整体目录结构如下:🚀 项目源码地址 : https://gitee.com/taisan/MaxKB4j 💡 提示:首次克隆项目后,请确认目录结构是否完整。
linmoo198621 小时前
人工智能·langchain·retrieval·rag·langchain4j
Langchain4j 系列之十九 - RAG之Retrieval上一个系列讲了Spring AI得到反馈效果不错,有人私信我说这个和Langchain4j有什么区别。如果站在使用方面,都是基于Java的大模型应用研发的工具,本质上没太大区别。但是从细节层面来说还是有很多不同之处,所以索性借此机会,给大家分享一下Langchain4j框架。在本系列中会按照Spring AI系列的顺序来写Langchain4j,这样的好处是可以对比两者不同的细节。
夏日白云1 天前
pdf·llm·大语言模型·rag·文档解析
《PDF解析工程实录》第 17 章|内容流里“看得见却看不见”的字符:那些幽灵文字从哪来?点此进入系列专栏如果你已经开始深入使用 PDF 内容流解析,迟早会遇到一种非常诡异、但又极其常见的现象:
空山新雨后、2 天前
人工智能·搜索引擎·rag
RAG:搜索引擎与大模型的完美融合在典型的 RAG 架构中:检索(Retrieval) 这一步本质上就是“搜索”,包括:关键词搜索(BM25 / 倒排索引)
dundunmm2 天前
人工智能·rag·本体论
【每天一个知识点】本体论很多人第一次听到“本体论(Ontology)”,要么是在哲学课堂上,要么是在做知识图谱、语义网、RAG 系统时被迫面对这个词。它看起来抽象、晦涩,但实际上,本体论正是让机器“理解世界结构”的关键工具。
laplace01232 天前
人工智能·语言模型·自然语言处理·agent·rag
agent模型基础语言模型 (Language Model, LM) 是自然语言处理的核心,其根本任务是计算一个词序列(即一个句子)出现的概率。一个好的语言模型能够告诉我们什么样的句子是通顺的、自然的 (1)统计语言模型与N-gram的思想 ![[Pasted image 20260111214303.png]] 为了解决这个问题,研究者引入了马尔可夫假设 (Markov Assumption) 。其核心思想是:我们不必回溯一个词的全部历史,可以近似地认为,一个词的出现概率只与它前面有限的 𝑛−1词有关,如图3.1所示。
海棠AI实验室2 天前
rag·upworker
01|栏目总览:成果型 Upworker 的能力地图与交付闭环(把“会做AI”升级为“能交付结果”的工程方法论)你会发现一个现实: Upwork 上高客单的 AI 项目,客户买的从来不是“你会不会 LangChain / 会不会写 prompt”,而是——你能不能把结果交付出来,并且稳定运行。
夏日白云2 天前
pdf·llm·大语言模型·rag·文档解析
《PDF解析工程实录》第 14 章|内容流文本布局计算:pdfminer 在做什么,以及它为什么不够点此进入系列专栏如果你在 PDF 解析里,哪怕只走过一次内容流路线,大概率都会在某个时刻和 pdfminer 正面相遇。不是因为它多完美,而是因为它几乎定义了一个事实:
Darenm1113 天前
rag
多模态RAG系统的实现随着大语言模型(LLM)的快速发展,检索增强生成(Retrieval-Augmented Generation,RAG)技术已成为构建智能问答系统的核心方案。传统RAG系统主要处理文本数据,但现实世界中的信息往往是多模态的,包含图像、表格、PPT等多种形式。本文将深入探讨多模态RAG系统的设计与实现,为开发者提供全面的技术指南。
程序员黄老师3 天前
数据库·大模型·向量·rag
主流向量数据库全面解析随着大语言模型(LLM)的快速发展,RAG(检索增强生成)技术成为解决模型“幻觉”、提升专业领域回答精度的核心方案,而向量数据库则是RAG技术的底层支撑。向量数据库专门用于存储、管理和检索高维嵌入向量(Embedding),通过高效的相似度匹配算法,快速从海量数据中找到与查询向量最相关的结果。
laplace01233 天前
人工智能·语言模型·自然语言处理·agent·rag
第三章 大语言模型基础核心问题:现代智能体是如何工作的? 核心答案:以 Transformer / Decoder-Only 架构为核心,通过大规模预训练 + 自回归生成 + 提示工程实现。
TTGGGFF3 天前
rag·重排序
什么是RAG重排序? 3 分钟落地最强轻量级重排序模型 BGE-Reranker-v2-m3在构建 RAG(检索增强生成)系统时,很多人会发现:即便用了向量数据库,检索回来的前几个文档依然可能“牛头不对马嘴”。这是因为向量搜索(粗排)侧重于语义空间的距离,而 Reranker(精排) 能够深度分析查询句与文档句之间的细微逻辑关系。
学Linux的语莫3 天前
langchain·rag
Rag操作-Ragas评估ContextPrecision(上下文精确度)1.检索器返回大量无关文档2.向量数据库索引策略有误、相关文档排名低等。
阿里巴巴P8资深技术专家3 天前
ai·ocr·ai大模型·rag·文档解析·mineru·tike
Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈
AI架构师易筋4 天前
开发语言·人工智能·llm·aiops·rag
AIOps 告警归因中的提示工程:从能用到可上生产(4 阶梯)适用对象:做生产运维 / SRE / 平台工程 / ITSM 流程治理的团队,想把 LLM 用在 告警归因(Root Cause Analysis, RCA) 上,并且做到“可控、可复用、可评测”。
深色風信子4 天前
rag·springai·springai rag
SpringAI Rag 文件读取