rag

Jay Kay3 小时前
agent·rag·wide_search
用 WideSearch 思路打造「零幻觉、全覆盖」的多 Agent 信息收集器在电商、金融、舆情、招聘等场景,我们常遇到这样一类需求:ByteDance 在论文《WideSearch: Benchmarking Agentic Broad Info-Seeking》中通过1000+真实案例测试指出:
岁月漫长_6 小时前
rag·llamaindex·llm应用开发
【RAG】使用llamaindex进行RAG开发123步会在user上传知识库文件后执行,45步会在user对知识库进行问答时执行。我们使用llamaindex完成rag整个过程,此外还需要:
LiRuiJie2 天前
python·langchain·milvus·rag
基于LangChain + Milvus 实现RAG使用 LangChain + Milvus(Lite 本地部署),并用 Hugging Face 的 thenlper/gte-large-zh 做 embedding。方案覆盖:环境准备、Milvus Lite 用法、embedding 实现、文本切片(chunking)、向量和文本入库、检索示例,以及常见注意点与扩展建议。
wfsm2 天前
rag
RAG检索增强生成RAG : retrieval augmented generation : 检索增强生成ETL : extract transform load
JolyouLu3 天前
大模型·提示词·向量数据库·rag·mcp·langchain4j
LangChain4J-基础(整合Spring、RAG、MCP、向量数据库、提示词、流式输出)LangChain4J(LangChain For Java)是专门为了简化Java应用在接入LMM的过程,它提供了统一的API如LLM模型的调用,向量数据库等方法,可以让Java应用程序快速接入大模型
zhayujie8 天前
ai·大模型·agent·知识库·rag
RAG优化实战 - LinkAI智能体平台的知识库升级之路RAG(Retrieval-Augmented Generation,检索增强生成)技术经过近两年的快速发展,已经从初期的概念验证阶段进入到了大规模企业级应用的关键时期。在这个过程中,单纯依靠简单的文档切分和基础的向量检索技术已经无法满足企业对于知识库问答质量的要求,需要在RAG技术的各个环节进行更为深入的优化。
爱知菜9 天前
azure·rag·ai search
Azure AI Search 探索总结Azure AI Search 原名 Azure Cognitive Service,是Azure中用来给AI项目构建知识库的组件。
两棵雪松15 天前
人工智能·rag
为什么RAG技术可以缓解大模型知识固话和幻觉问题1、大模型知识固化和幻觉问题要理解大模型的时效性问题,需首先明确其技术原理:大模型通过输入文本与已固化在神经网络中的知识进行匹配,预测并输出概率最大的文本内容作为答案。其固化知识的神经网络形成于前期训练阶段,训练输入源自人类现有知识数据(包括互联网及线下知识数据)。模型一旦训练完成,其知识范围便被固定,回答能力完全取决于训练时的数据内容。 幻觉产生的原因是:无论匹配概率多低,模型总会生成输出,这种缺乏依据的输出如同人类空想,即形成幻觉。 如图所示:若大模型A基于2024年12月31日前的数据训练,当询问"
真就死难16 天前
python·embedding·rag
适用于个人开发、中小型项目的Embedding方案(配合ChromaDB)付费方案:适用于需要特殊处理逻辑的情况可以把这个类传给 Chroma 的 embedding_function=... 参数来完成定制化集成。
一包烟电脑面前做一天17 天前
.net·向量数据库·ai大模型·rag·ollama·qdrant·文本分块
RAG实现:.Net + Ollama + Qdrant 实现文本向量化,实现简单RAG本文使用.Net + Ollama + 向量数据库Qdrant,实现简单RAG,代码仅实现基本演示功能。
大千AI助手18 天前
人工智能·大模型·llm·微调·rag·检索·ragfoundry
RAGFoundry:面向检索增强生成的模块化增强框架本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
weixin_4380774920 天前
服务器·langchain·rag
langchain入门笔记02:几个实际应用参考文献: https://python.langchain.com/docs/tutorials/llm_chain/ https://www.bilibili.com/video/BV1pYKgzAE5C 本文仅仅用于学习记录langchain的基础内容。感谢以上参考文献。 本文的完整代码,可从笔者的gitee下载。
一包烟电脑面前做一天1 个月前
.net·onnx·rag·文本向量化·本地大模型·qdrant
.Net + Qdrant 使用Microsoft.ML.OnnxRuntime调用本地大模型实现文本向量化,实现简单RAG本文使用.Net + 向量数据库Qdrant,实现使用本地大模型(Onnx)实现简单RAG,代码仅实现基本演示功能。
精致先生1 个月前
人工智能·大模型·rag
RAG(检索增强生成)先通过信息 检索模块 从外部知识库(如数据库、文档、网页等)中获取相关的上下文信息,然后再将这些信息与原始输入一起传递给生成模型,生成更具上下文关联的回复。
GEM的左耳返1 个月前
prompt工程·向量数据库·java面试·rag·ai应用·spring ai
Java AI面试实战:Spring AI与RAG技术落地面试官:谢飞机同学,今天我们聚焦Java AI应用开发,重点考察Spring AI和RAG技术栈。 谢飞机:(兴奋地)面试官好!我可是AI达人!ChatGPT、Midjourney我天天用,Spring AI这新框架我也研究过!
在未来等你1 个月前
nlp·rag·retrieval-augmented generation·prompt engineering·context management
RAG实战指南 Day 24:上下文构建与提示工程欢迎来到"RAG实战指南"系列的第24天!今天我们将深入探讨RAG系统中至关重要的上下文构建与提示工程技术。在检索增强生成系统中,如何有效地组织检索到的文档片段,并将其转化为适合大语言模型(LLM)处理的提示,直接决定了最终生成结果的质量。本文将系统讲解上下文构建的最佳实践和高级提示工程技术,帮助您构建更精准、更可靠的RAG应用。
deephub1 个月前
人工智能·深度学习·神经网络·langchain·大语言模型·rag
AI代理性能提升实战:LangChain+LangGraph内存管理与上下文优化完整指南在AI代理系统的开发过程中,上下文工程已成为决定系统性能的关键技术。上下文工程本质上是在为AI系统分配任务之前建立合适的执行环境,这个环境需要包含明确的行为指令(如配置AI充当专业的预算旅行顾问)、来自数据库、文档或实时数据源的有用信息访问权限、对历史对话的记忆能力以避免信息重复或遗忘、可供AI调用的工具集(计算器、搜索引擎等功能组件),以及用户的个性化信息(偏好设置、地理位置等关键细节)。
真就死难1 个月前
人工智能·机器学习·rag
Rerank 模型的其中两种路径:BERT 相似度与 CoT 推理在构建高性能的问答系统或检索增强生成(RAG)架构时,Rerank(重排序)模块是信息检索质量的关键环节。它决定了哪些文档将最终送入大模型生成答案,因此直接影响回答的准确性与可用性。
缘友一世1 个月前
rag·langgraph
ReAct Agent(LangGraph实现)================================ Human Message =================================
会写代码的斯皮尔伯格1 个月前
openai·微服务架构·java面试·rag·ollama·spring ai·spring boot 3
Spring Boot 3整合Spring AI实战:9轮面试对话解析AI应用开发周先生:cc,先聊聊Spring AI的基础配置吧。如何在Spring Boot 3项目中集成Ollama?