rag

虎妞05003 小时前
milvus·向量数据库·chroma·rag·weaviate
向量数据库选型指南:Milvus vs Chroma vs WeaviateRAG 架构让向量数据库成为 AI 基础设施核心。与传统数据库不同,向量数据库专为高维向量相似性搜索设计。
染指11106 小时前
人工智能·rag·advanced rag
21.RAG进阶(Advanced RAG)-RAG存在的问题(Advanced RAG)内容参考于:图灵AI大模型全栈实现一个RAG的流程:首先加载文件,然后读取文件中的文本,然后分割文本,然后把文本转成向量,然后保存成知识库,然后把我们的问题也转成向量,然后使用问题的向量去知识库中搜索,把搜索到的知识添加到向ai大模型提问的提示词中,然后提交给大模型回答
SiYuanFeng8 小时前
人工智能·面试·transformer·agent·rag
大模型 / RAG / Agent 面试高频题这篇文章《大模型 / RAG / Agent 面试基础高频题》,适合准备以下方向:(这里主要是介绍自己的项目,这里就不给出标准答案了)
codefan※8 小时前
大模型·llm·向量数据库·rag
Reranker 模型实战:让 RAG 检索精度再提升 20%如果你做过 RAG(Retrieval-Augmented Generation)项目,一定遇到过这个痛点:**向量检索召回了 20 条文档,但真正相关的只有前 3 条,后面全是噪音。**这些噪音不仅浪费 Token,还会干扰 LLM 的推理,导致生成结果质量下降。
中草药z9 小时前
java·深度学习·机器学习·阿里云·rag·springai
【RAG】工程化实战:全链路原理复盘 + 方案选型 + 实战高阶玩法🔥个人主页: Ryan🔥专栏:【后端】登神长阶 实战落地后端全路线手册在 AI 圈子里,一直流传着一个心照不宣的秘密:用 LangChain 或 LlamaIndex 几行代码搭一个 RAG(检索增强生成)系统,只需要一个下午;但要让它达到生产环境的落地上线标准,往往需要大半年。
码农飞哥1 天前
python·知识库·向量检索·rag·效果提示
我把RAG召回率从60%提到90%,就改了这两件事💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精通
要开心吖ZSH1 天前
java·ai·agent·健康医疗·rag
AI医疗分诊与健康咨询助手agent开发——(0)项目背景与概要说起来这个想法不是突然冒出来的,是几条线慢慢汇到一起的。我目前在做互联网医院的项目,上线之后发现一个很明显的问题——我们的挂号流程是"直筒式"的:选医院,然后医院各科室列表摆在这儿,你自己选,自己挂。系统不会问你哪里不舒服,也不会帮你判断该挂哪个科。结果就是,患者挂错科的情况时有发生。每次看到客服反馈过来的这类工单,我心里就想:这个环节,明显是能用技术优化的。
星马梦缘2 天前
人工智能·rag·提示词工程·mcp
提示词工程 与 实践 合集大型语言模型本质上是一个黑箱,而提示就是我们与它沟通的唯一接口。就像我们使用自然语言与人交流一样,提示也是我们向LLM下达指令、描述任务、提供上下文的主要方式。
小刘|2 天前
langchain·rag
揭秘RAG:检索增强生成技术解析什么是 RAG?RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了 信息检索 与 大语言模型 的技术框架。它旨在通过引入外部知识源,弥补大模型在事实性、时效性及私有化知识方面的短板。
菜到离谱但坚持2 天前
python·langchain·rag
【小白零基础】RAG+LangChain 搭建私有知识库问答系统(完整可运行代码+超详细教程+避坑指南)收藏⭐ + 点赞👍 + 关注✅ 零基础入门大模型RAG应用,保姆级教程,新手零翻车!哈喽大家好!很多刚入门大模型的小伙伴都有一个疑问:如何让AI学习自己的私有资料?
HappyAcmen2 天前
python·pdf·rag
2.PDF长文档完整读取RAG = 给大模型(比如 ChatGPT、豆包、开源大模型)外挂了一个你自己的私有知识库,让大模型能精准、无差错地回答你私有数据里的内容,不会瞎编、不会用过时的知识。
尽兴-2 天前
rag·混合检索·chunk 分块·rerank 重排
2.2 RAG 体系:RAG、Chunk 分块、Rerank 重排、混合检索Embedding 让文字变成了数字,但光有向量还不够——你需要一整套流程把「用户提问」变成「精准答案」。这就是 **RAG(检索增强生成)**,目前大模型落地最成熟、最实用的技术方案。没有 RAG,LLM 只是一个「能聊但不懂你业务」的聊天机器人;有了 RAG,它才能变成真正懂你的业务助手。
你不是我我2 天前
agent·rag
【Agent 学习日记】Agent 的记忆是如何设计的?短期记忆和长期记忆有什么区别?目录🍕一、Agent 记忆的整体设计框架🍕二、短期记忆 —— 任务的“工作台”🍕三、长期记忆 —— 经验的“知识库”
染指11102 天前
人工智能·python·机器学习·langchain·agent·rag
19.LangChain框架7-LangChain1.0版本使用Agent(中间件实例)内容参考于:图灵AI大模型全栈后面会有专门的Agent详细玩法,这里只是做一个了解1.0的调用方式比0.3版本简单很多
lianyinghhh3 天前
python·低代码·开源·vue·rag·flowgame·ai工作流编排
FlowGame 从零上手:开源 AI 工作流编排框架与 Vue 3 接入实战导读:FlowGame 是一款轻量级、可私有化部署的 AI 工作流编排框架。本文将从零开始,带你完成「克隆仓库 → 启动编辑器 → Vue 3 嵌入 → Python 后端联调」全流程,适合希望在自有业务系统中集成可视化 AI 工作流的开发者
SL-staff3 天前
人工智能·系统架构·私有化部署·rag·ai知识库·llama3·jvs-ai
企业级私有化AI知识库完整搭建指南:从RAG架构到Llama 3落地实践企业内部文档分散、检索效率低下是普遍痛点。基于检索增强生成(RAG)的AI知识库能以自然语言问答方式提升信息获取效率,但公有云服务存在数据安全风险。本文详细记录了一家科技公司私有化部署RAG知识库的全过程:基于JVS-AI开源套件,集成Llama 3 8B模型和Chroma向量数据库,实现了2000份文档的智能问答,准确率达85%,响应时间控制在2-3秒。文章涵盖架构设计、部署步骤、性能调优、权限隔离及常见问题解决方案,为有类似需求的企业提供可直接参考的技术实践。
逻极3 天前
llm·agent·react·rag·多智能体系统
Hermes Agent深度解析:从ReAct到多智能体系统架构实战核心观点: Agent不是简单的API调用,而是一个能感知、思考、行动和适应的自主系统。在人工智能的浪潮中,大型语言模型(LLMs)的出现无疑是划时代的事件。它们赋予了机器前所未有的自然语言理解和生成能力。然而,如果将 LLMs 视为强大的“大脑”,那么如何让这个大脑真正具备“行动力”、“记忆力”和“规划能力”,从而解决现实世界复杂的、多步骤的问题,则是当前 AI 领域的核心挑战。
韦东东3 天前
人工智能·大模型·油猴脚本·rag·tampermonkey·userscript
究极方案:油猴脚本实现RAG问答前端图片流式体验一个月前发了篇文章介绍了基于 MiniO 存储的 RAGFlow+Dfiy 图片处理方案,之后有几个知识星球内的星友提问,如何优化上一版方案中不能流式输出的问题。
Cosolar3 天前
人工智能·系统架构·大模型·agent·rag
AutoGen:微软开源的多Agent对话框架详解AutoGen 是微软研究院推出的一款开源多 Agent 对话框架,旨在简化多个 LLM Agent(大语言模型智能体)之间的协作。它让 AI Agent 之间可以相互对话、交换信息、协作完成复杂任务。
阿昌喜欢吃黄桃4 天前
java·ai·langchain·开源·rag·springai·langchain4j
Java优质开源AI项目Hi,我是阿昌,今天记录下几个 Java AI 开源项目。以前提到 AI 开发,大家第一反应基本都是 Python。