rag

minhuan7 天前
人工智能·语言模型·自然语言处理·bert·ai大模型·rag
构建AI智能体:二十八、大语言模型BERT:原理、应用结合日常场景实践全面解析BERT(Bidirectional Encoder Representations from Transformers)是谷歌在2018年发布的自然语言处理模型,它彻底改变了NLP领域的发展轨迹。在BERT出现之前,主流模型如Word2Vec只能提供静态的词向量表示,这些方法虽然解决了词汇的分布式表示问题,但无法处理一词多义和复杂的上下文信息。例如,"苹果"这个词在不同语境中既可能指水果,也可能指科技公司,传统模型无法区分这种差异。
悟乙己9 天前
开发语言·python·agent·rag·n8n
使用 Python 中的强化学习最大化简单 RAG 性能本篇文章:Maximizing Simple RAG Performance Using RL in Python适合对强化学习和信息检索有兴趣的读者,亮点在于通过自定义的强化学习奖励系统,将简单的检索增强生成(RAG)模型的检索质量从53%提升至84%。作者详细介绍了如何从零开始实现该模型,且代码清晰易懂。
nju_spy11 天前
人工智能·机器学习·大模型·rag·南京大学·gpu分布计算·wikipedia 维基百科
Kaggle - LLM Science Exam 大模型做科学选择题Kaggle - LLM Science ExamScience Exam Simple Approach w/ Model Hub | Kaggle
deepdata_cn13 天前
rag
开源检索增强生成(UltraRAG)框架UltraRAG 是由清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 与 AI9Stars 联合开发的开源检索增强生成(RAG)框架,专注于低代码构建复杂推理系统,尤其适合科研实验与行业落地场景。 UltraRAG 的技术架构以 “低代码、高扩展、双场景适配(科研+行业)” 为核心设计理念,通过分层解耦、标准化协议和模块化组件,实现 RAG(检索增强生成)全流程的灵活编排与高效落地。其架构可拆解为 “1个核心协议 + 4层技术栈 + 3大关键模块”。
knqiufan15 天前
python·langchain·llm·rag
LangChain 表达式语言 (LCEL):从序列链接到并行执行在 LLM 应用的开发浪潮中,LangChain 框架迅速成为最受欢迎的工具之一。随着应用的主键复杂化,复杂的 RAG、智能体(Agent)、多步骤推理等需求变得普遍,早期的编程范式逐渐显露出了局限性,面向对象的链式构建方式在应对这种复杂性时显得非常笨拙和难以维护。所以 LangChain 在 2023 年 8 月推出了 LCEL(LangChain Expression Language, LangChain 表达式语言),进行了范式的升级。
minhuan15 天前
人工智能·langchain·rag·faiss向量数据库
构建AI智能体:十八、解密LangChain中的RAG架构:让AI模型突破局限学会“翻书”答题在人工智能领域,我们常常遇到两个核心挑战:如何让模型获取最新知识,以及如何让模型基于特定信息生成准确答案。RAG(Retrieval-Augmented Generation:检索增强生成) 提供了一种解决这些挑战的范式,而 LangChain 则提供了实现这一范式的完整工具箱。二者的结合,就像RAG给了建筑师既有了设计蓝图,而LangChain又有了全套现代化工具,让构建智能应用变得前所未有的高效和可靠。
hllqkbb16 天前
人工智能·python·rag
从零开始写个deer-flow-mvp-第一天想开个blog记录一下自己的java转大模型之路,在这个路上许多都是未知,也许会有些犹豫,想要把自己的心路历程记录下来,供大家参考与交流。今天是第一天,先说明本人python基础薄弱,写过类似的项目,就想再写一个用来写在简历上,
乔公子搬砖18 天前
大数据·人工智能·python·ai·milvus·rag·向量库
构建企业级RAG系统:基于Milvus的模块化实现与全流程解析
一条测试老狗19 天前
gpt·微调·rag·幻觉·icl·gpt-5·垂直领域模型
从GPT-5发布来分析LLM大模型幻觉收敛(一)GPT-5 号称在任何领域都有博士级别能力。在医疗健康领域,能够对专业的癌症诊断报告做通俗易懂的解读。对复杂的放射治疗方案决策,也能提供详细的分析报告,帮助病人权衡利弊。一位癌症患者的家属在发布会上表示,“ 真正鼓舞人心的是看着她通过使用 GPT-5 重新获得自主权,病人很容易感到无助,因为知识差距太大了。
Jay Kay21 天前
agent·rag·wide_search
用 WideSearch 思路打造「零幻觉、全覆盖」的多 Agent 信息收集器在电商、金融、舆情、招聘等场景,我们常遇到这样一类需求:ByteDance 在论文《WideSearch: Benchmarking Agentic Broad Info-Seeking》中通过1000+真实案例测试指出:
岁月漫长_21 天前
rag·llamaindex·llm应用开发
【RAG】使用llamaindex进行RAG开发123步会在user上传知识库文件后执行,45步会在user对知识库进行问答时执行。我们使用llamaindex完成rag整个过程,此外还需要:
LiRuiJie23 天前
python·langchain·milvus·rag
基于LangChain + Milvus 实现RAG使用 LangChain + Milvus(Lite 本地部署),并用 Hugging Face 的 thenlper/gte-large-zh 做 embedding。方案覆盖:环境准备、Milvus Lite 用法、embedding 实现、文本切片(chunking)、向量和文本入库、检索示例,以及常见注意点与扩展建议。
wfsm23 天前
rag
RAG检索增强生成RAG : retrieval augmented generation : 检索增强生成ETL : extract transform load
JolyouLu24 天前
大模型·提示词·向量数据库·rag·mcp·langchain4j
LangChain4J-基础(整合Spring、RAG、MCP、向量数据库、提示词、流式输出)LangChain4J(LangChain For Java)是专门为了简化Java应用在接入LMM的过程,它提供了统一的API如LLM模型的调用,向量数据库等方法,可以让Java应用程序快速接入大模型
zhayujie1 个月前
ai·大模型·agent·知识库·rag
RAG优化实战 - LinkAI智能体平台的知识库升级之路RAG(Retrieval-Augmented Generation,检索增强生成)技术经过近两年的快速发展,已经从初期的概念验证阶段进入到了大规模企业级应用的关键时期。在这个过程中,单纯依靠简单的文档切分和基础的向量检索技术已经无法满足企业对于知识库问答质量的要求,需要在RAG技术的各个环节进行更为深入的优化。
爱知菜1 个月前
azure·rag·ai search
Azure AI Search 探索总结Azure AI Search 原名 Azure Cognitive Service,是Azure中用来给AI项目构建知识库的组件。
两棵雪松1 个月前
人工智能·rag
为什么RAG技术可以缓解大模型知识固话和幻觉问题1、大模型知识固化和幻觉问题要理解大模型的时效性问题,需首先明确其技术原理:大模型通过输入文本与已固化在神经网络中的知识进行匹配,预测并输出概率最大的文本内容作为答案。其固化知识的神经网络形成于前期训练阶段,训练输入源自人类现有知识数据(包括互联网及线下知识数据)。模型一旦训练完成,其知识范围便被固定,回答能力完全取决于训练时的数据内容。 幻觉产生的原因是:无论匹配概率多低,模型总会生成输出,这种缺乏依据的输出如同人类空想,即形成幻觉。 如图所示:若大模型A基于2024年12月31日前的数据训练,当询问"
真就死难1 个月前
python·embedding·rag
适用于个人开发、中小型项目的Embedding方案(配合ChromaDB)付费方案:适用于需要特殊处理逻辑的情况可以把这个类传给 Chroma 的 embedding_function=... 参数来完成定制化集成。
一包烟电脑面前做一天1 个月前
.net·向量数据库·ai大模型·rag·ollama·qdrant·文本分块
RAG实现:.Net + Ollama + Qdrant 实现文本向量化,实现简单RAG本文使用.Net + Ollama + 向量数据库Qdrant,实现简单RAG,代码仅实现基本演示功能。
大千AI助手1 个月前
人工智能·大模型·llm·微调·rag·检索·ragfoundry
RAGFoundry:面向检索增强生成的模块化增强框架本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!