rag

nju_spy3 天前
人工智能·面试·lora·大模型·rag·提示词工程·peft微调
大模型面经(一) Prompt + RAG + 微调目录大模型微调问题一:领域微调中,如何平衡 “领域知识习得” 和 “通用能力保留”?问题二:SFT 后模型出现 “指令遵循能力下降”
whltaoin5 天前
人工智能·spring·阿里云·向量数据库·rag
AI 超级智能体全栈项目阶段四:学术分析 AI 项目 RAG 落地指南:基于 Spring AI 的本地与阿里云知识库实践简介:github项目地址: 学术分析AI应用 本文使用的AI大模型均为阿里云的灵积模型(Qwen-Plus)
XiaoLeisj6 天前
阿里云·原型模式·rag·spring ai·灵积大模型
【SpringAI】第四弹:深入解析 Rag 检索增强工作流程、最佳实践和调优以 Spri‏ng AI 框架为例,‏学习 RAG 知识库应‏用开发的核心特性和高级‏知识点,并且掌握 RA‌G 最佳实践和调优技巧。
精致先生8 天前
pdf·大模型·rag
多模态PDF解析在多模态 RAG(Retrieval-Augmented Generation)系统中,多模态 PDF 的解析是核心前提 —— 其目标不仅是提取传统文本信息,更要精准识别、分离并结构化 PDF 中嵌入的非文本模态内容(如图像、表格、公式、图表等),同时保留各模态与文本的上下文关联(如 “某段文字对应下方图表”“某公式解释了左侧数据表格”),为后续检索和生成提供结构化的多模态数据基础。
spader-ai9 天前
人工智能·大模型·rag·上下文工程
RAG is really dead? 大模型和知识之间的桥梁没了?作者:SpaderMan最近,Latent Space 播客发布了一期标题为["RAG 已死,上下文工程为王"](https://www.latent.space/p/chroma ""RAG 已死,上下文工程为王"")的访谈,其中开源向量数据库 Chroma 的创始人 Jeff Huber 的观点引发了广泛讨论。这个观点触及了一个核心问题:我们是否真的理解自己在构建什么?
有点不太正常12 天前
论文阅读·安全·大模型·rag
FlippedRAG——论文阅读RAG 把检索的上下文直接送给LLM,能降低幻觉但也引入“检索端被污染 → 影响生成” 的攻击面。此前工作多集中在白盒或针对事实型问答(“苹果的CEO是谁”)的攻击,而对争议/开放式问题(eg“堕胎是否犯法”)的“意见操纵”研究较少且更危险(能改变用户认知)。论文正是面向这种现实且高危的攻击场景。
A尘埃12 天前
rag·ollama·cherry studio
Cherry Studio+Ollama+大模型+向量模型,实现RAG私有知识库。智能体实现EXCEL转化为一个报表图表一、安装Ollama二、配置大模型三、配置嵌入模型四、安装Cherry Studio五、搭建本地知识库
OliverYeung14 天前
人工智能·ai·llm·rag·agentic·deepseek·agno
【AskAI系列课程】:P3.Agno从阿里云百炼知识库中检索知识库片段并回答用户问题这是【AskAI系列课程】的第 3 课:实现 Bailian retriever 并将其集成到 Agno Agent 中,让 AI 助手能够基于知识库内容(我的网站文档和博客内容)回答用户问题。
zbk.gyl14 天前
人工智能·ai·大模型·agent·rag·智能体·lazyllm
LazyLLM端到端实战:用RAG+Agent实现自动出题与学习计划的个性化学习助手智能体最近,我在写一本关于Git和开源的技术书,这本书未来有个推广方向,就是面向高校作为教材使用。所以我需要在每一章结束在之后,设计若干道练习题,然后还需要为这本书编写配套的PPT以及学习计划,作为授课老师的参考资料。基于我在Git实际操作管理方面积累的经验以及参与各类开源项目竞赛的经历,书稿本身的撰写过程相对顺利,目前也已经完成了几个章节内容的编写。
minhuan1 个月前
人工智能·语言模型·自然语言处理·bert·ai大模型·rag
构建AI智能体:二十八、大语言模型BERT:原理、应用结合日常场景实践全面解析BERT(Bidirectional Encoder Representations from Transformers)是谷歌在2018年发布的自然语言处理模型,它彻底改变了NLP领域的发展轨迹。在BERT出现之前,主流模型如Word2Vec只能提供静态的词向量表示,这些方法虽然解决了词汇的分布式表示问题,但无法处理一词多义和复杂的上下文信息。例如,"苹果"这个词在不同语境中既可能指水果,也可能指科技公司,传统模型无法区分这种差异。
悟乙己1 个月前
开发语言·python·agent·rag·n8n
使用 Python 中的强化学习最大化简单 RAG 性能本篇文章:Maximizing Simple RAG Performance Using RL in Python适合对强化学习和信息检索有兴趣的读者,亮点在于通过自定义的强化学习奖励系统,将简单的检索增强生成(RAG)模型的检索质量从53%提升至84%。作者详细介绍了如何从零开始实现该模型,且代码清晰易懂。
nju_spy1 个月前
人工智能·机器学习·大模型·rag·南京大学·gpu分布计算·wikipedia 维基百科
Kaggle - LLM Science Exam 大模型做科学选择题Kaggle - LLM Science ExamScience Exam Simple Approach w/ Model Hub | Kaggle
deepdata_cn1 个月前
rag
开源检索增强生成(UltraRAG)框架UltraRAG 是由清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 与 AI9Stars 联合开发的开源检索增强生成(RAG)框架,专注于低代码构建复杂推理系统,尤其适合科研实验与行业落地场景。 UltraRAG 的技术架构以 “低代码、高扩展、双场景适配(科研+行业)” 为核心设计理念,通过分层解耦、标准化协议和模块化组件,实现 RAG(检索增强生成)全流程的灵活编排与高效落地。其架构可拆解为 “1个核心协议 + 4层技术栈 + 3大关键模块”。
knqiufan1 个月前
python·langchain·llm·rag
LangChain 表达式语言 (LCEL):从序列链接到并行执行在 LLM 应用的开发浪潮中,LangChain 框架迅速成为最受欢迎的工具之一。随着应用的主键复杂化,复杂的 RAG、智能体(Agent)、多步骤推理等需求变得普遍,早期的编程范式逐渐显露出了局限性,面向对象的链式构建方式在应对这种复杂性时显得非常笨拙和难以维护。所以 LangChain 在 2023 年 8 月推出了 LCEL(LangChain Expression Language, LangChain 表达式语言),进行了范式的升级。
minhuan1 个月前
人工智能·langchain·rag·faiss向量数据库
构建AI智能体:十八、解密LangChain中的RAG架构:让AI模型突破局限学会“翻书”答题在人工智能领域,我们常常遇到两个核心挑战:如何让模型获取最新知识,以及如何让模型基于特定信息生成准确答案。RAG(Retrieval-Augmented Generation:检索增强生成) 提供了一种解决这些挑战的范式,而 LangChain 则提供了实现这一范式的完整工具箱。二者的结合,就像RAG给了建筑师既有了设计蓝图,而LangChain又有了全套现代化工具,让构建智能应用变得前所未有的高效和可靠。
hllqkbb1 个月前
人工智能·python·rag
从零开始写个deer-flow-mvp-第一天想开个blog记录一下自己的java转大模型之路,在这个路上许多都是未知,也许会有些犹豫,想要把自己的心路历程记录下来,供大家参考与交流。今天是第一天,先说明本人python基础薄弱,写过类似的项目,就想再写一个用来写在简历上,
乔公子搬砖1 个月前
大数据·人工智能·python·ai·milvus·rag·向量库
构建企业级RAG系统:基于Milvus的模块化实现与全流程解析
一条测试老狗1 个月前
gpt·微调·rag·幻觉·icl·gpt-5·垂直领域模型
从GPT-5发布来分析LLM大模型幻觉收敛(一)GPT-5 号称在任何领域都有博士级别能力。在医疗健康领域,能够对专业的癌症诊断报告做通俗易懂的解读。对复杂的放射治疗方案决策,也能提供详细的分析报告,帮助病人权衡利弊。一位癌症患者的家属在发布会上表示,“ 真正鼓舞人心的是看着她通过使用 GPT-5 重新获得自主权,病人很容易感到无助,因为知识差距太大了。
Jay Kay1 个月前
agent·rag·wide_search
用 WideSearch 思路打造「零幻觉、全覆盖」的多 Agent 信息收集器在电商、金融、舆情、招聘等场景,我们常遇到这样一类需求:ByteDance 在论文《WideSearch: Benchmarking Agentic Broad Info-Seeking》中通过1000+真实案例测试指出:
岁月漫长_1 个月前
rag·llamaindex·llm应用开发
【RAG】使用llamaindex进行RAG开发123步会在user上传知识库文件后执行,45步会在user对知识库进行问答时执行。我们使用llamaindex完成rag整个过程,此外还需要: