rag

zhoupenghui1685 小时前
人工智能·docker·ai·milvus·rag·attu·rag智慧问答项目
【AI大模型应用开发】【项目实战】13.RAG智慧问答项目-(一)项目介绍&项目架构&项目环境配置近年来,随着ChatGPT的广泛应用,基于大规模语言模型(LLM)的技术已成为人工智能领域的研究和应用热点,。尤其是大模型在各类自然语言处理任务中的成功应用,推动了教育行业的智能化转型。然而,当前市面上大多数大语言模型存在一个普遍的问题:这些模型主要依赖于过往的训练数据,无法动态获取最新的知识以及各企业特有的私有知识。这种局限性常常导致生成答案时出现“幻觉”问题,即模型提供的答案与实际情况不符或不准确。
Devin~Y10 小时前
java·spring boot·redis·spring cloud·kafka·agent·rag
抖音级短视频推荐与直播带货平台面试实战:从 Java 微服务到 RAG 智能客服全链路解析场景:某头部互联网大厂,业务方向为短视频推荐 + 直播带货电商,主技术栈为 Java、Spring 全家桶、微服务、Kafka、Redis、Elasticsearch、Kubernetes,以及最新接入的 AI RAG 智能客服与内容审核能力。
阿拉斯攀登10 小时前
检索增强·知识库·向量数据库·rag·企业级应用
企业级RAG架构:权限控制、安全防护与多租户Demo 和生产的差距有多大?这么说吧——Demo 是一个 Python 脚本,生产是一整套系统。前面的文章我们把 RAG 的核心链路都跑通了,但真要上线给公司几十上百号人用,还有四个关键问题要解决:权限控制、安全防护、多租户隔离、生产化部署。今天逐一拆解。
捧 花10 小时前
架构·llm·agent·rag
YoudaoNoteLM 分层混合 RAG 系统:从多源接入到智能问答的全链路技术架构在大模型落地知识库场景的过程中,传统轻量化 RAG 方案普遍存在诸多痛点:多源资料适配性差、文档结构混乱导致检索失真、切块粒度单一造成精准度与上下文完整性无法兼顾、检索方式单一、问答上下文碎片化、资料运维能力薄弱等问题。
meilindehuzi_a11 小时前
node.js·rag
从零开始:用原生 Node.js 徒手拆解 RAG 与向量检索底层原理在人工智能技术爆发的今天,大语言模型(LLM)展现出了惊人的文本生成与理解能力。然而,在面对特定垂直领域知识或企业内部私有数据时,通用大模型常常会显得力不从心,甚至产生“幻觉”(即一本正经地胡说八道)。为了解决这一痛点,RAG(Retrieval-Augmented Generation,检索增强生成) 架构应运而生。
阿拉斯攀登11 小时前
人工智能·langchain·agent·rag·function
Agent 框架对比:LangChain / AutoGPT / CrewAI做 Agent 不用从零写,有很多成熟框架可选。这篇对比主流的 Agent 开发框架:LangChain、AutoGPT、CrewAI、LlamaIndex、LangGraph,各自的特点、适用场景,以及选型建议。
组合缺一12 小时前
java·开发语言·ai·llm·solon·rag
用 ChatModel 构建 LLM 驱动的 Java 应用如果你尝试过在 Java 应用中集成大语言模型(LLM),大概率写过不少样板代码:HTTP 客户端、JSON 解析、流式处理、会话管理……Solon AI 4.0 的 ChatModel 用一套简洁的 Builder API 把这些都封装好了。
阿拉斯攀登1 天前
人工智能·数据分析·embedding·知识库·rag·企业知识库·增强检索
AI数据助手:从文档问答到智能数据分析前面 9 篇我们把 RAG 问答系统从零搭到了生产级。但一个真正的"AI 数据助手",不能只会翻文档回答问题。它应该能帮你做数据分析、生成报表、甚至从一堆数据里挖出你不知道的信息。
阿拉斯攀登1 天前
数据库·elasticsearch·milvus·知识库·rag·个人知识库
向量数据库选型:Milvus vs Chroma vs ElasticsearchEmbedding 模型选好了,接下来第二个关键选型:往哪存这些向量?市面上的向量数据库少说也有十几个。我把最主流的三个——Chroma、Milvus、Elasticsearch——跑了一遍同条件的性能测试,今天给你一个不带废话的选型指南。
特别关注外国供应商1 天前
人工智能·专利·rag·genai·ai工具·gaia·cohesity
Cohesity 获得 第 12,619,501 号专利,该专利涵盖了其企业数据生成式人工智能平台 Cohesity Gaia™ 的基础技术Cohesity 宣布,美国专利商标局 (USPTO) 已授予该公司第 12,619,501 号专利,该专利涵盖了其企业数据生成式人工智能平台 Cohesity Gaia™ 的基础技术。该专利名为“使用嵌入技术检索备份系统中的数据”,于 2026 年 5 月 5 日颁发,涵盖了 Cohesity 的专有方法,该方法将辅助数据系统与检索增强生成 (RAG) 语义层相结合,从而为 GenAI 应用提供支持。Cohesity 是首家获得此方法专利的数据保护供应商,该方法使企业能够在不创建新的数据孤岛、不削弱治理
CCPC不拿奖不改名1 天前
linux·服务器·数据库·redis·深度学习·缓存·rag
Redis 工程化部署深度解析📖 本文档定位:本文是 Redis数据库工程化部署安装流程.md 的配套解析文档。部署流程文档回答「怎么做」,本文档回答「为什么这么做、每条命令的原理是什么、不这么做会怎样」。
小折耳猫_1 天前
大模型·rag·智能体
大模型技术路线及场景选型指南核心目标:搞懂大模型是什么、能做什么、怎么选1. 大模型基础概念:通用大模型:GPT、Qwen、Llama、DeepSeek等
毒爪的小新1 天前
linux·人工智能·ai·milvus·rag
踩坑实录 | RAG知识库完整搭建-Milvus2.4+BGE大中文AI模型嵌入RAG(Retrieval-Augmented Generation,检索增强生成)在2020年被首次提出,是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息,并将其作为提示(prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力。
带刺的坐椅1 天前
java·ai·llm·solon·rag·chatmodel
用 ChatModel 构建 LLM 驱动的 Java 应用如果你尝试过在 Java 应用中集成大语言模型(LLM),大概率写过不少样板代码:HTTP 客户端、JSON 解析、流式处理、会话管理……Solon 4.0 的 ChatModel 用一套简洁的 Builder API 把这些都封装好了。
leonshi2 天前
ai·rag·ollama
使用embedchain快速建立rag知识库,本地大模型初学RAG搭建知识库,强烈建议先利用embedchain这个开源的RAG框架,短短几行代码就能让你快速建立一个私人知识库,并支持随时增加知识源,是理想的学习和使用RAG知识的开源利器
秋名山码民18 天前
大数据·人工智能·rag
Graph RAG 深度解析:从向量检索到知识推理的技术演进在 RAG 领域深耕的这两年,我们走过了三段技术迭代之路:从最初的向量检索 RAG,到多智能体协同 RAG,再到目前聚焦落地的 Graph RAG。每一次技术升级,都是为了解决上一代架构的核心瓶颈,每一步演进都在朝着「让 AI 真正理解知识、而非匹配文本」的核心目标靠近。本文是我们团队完整的技术演进阶段性总结,将重点深度拆解 Graph RAG 的原理、架构、落地难点与解决方案,同时清晰梳理我们从传统向量 RAG 迭代至 Graph RAG 的完整思考路径。
Artech19 天前
ai·agent·rag·maf
[MAF预定义的AIContextProvider-01]TextSearchProvider——RAG在MAF中的实现作为最核心的AIAgent,ChatClientAgent构建了一个管道与LLM交互。为了让管道的输出更符合我们的需求,有两个主要的途径:输入增强(Input Enhancement)和输出增强(Output Enhancement),前者通过通过改变输入让LLM返回更高质量的内容,后者则直接对LLM的输出进行加工处理。个注册的AIContextProvider组成的管道位于ChatClientAgent管道的中间件部分(前后分别是AIAgent中间件管道和ChatClient管道),是专门为输入和输出增
染指111019 天前
人工智能·windows·agent·rag·advanced rag
26.RAG进阶(Advanced RAG)-假设性问题索引内容参考于:图灵AI大模型全栈假设性问题索引做的事情对文档内容(切分之后的文档),提炼出三个问题,把提炼出来的问题转成向量存到数据库,然后比对的数据就是问题,转换成问题后语意会比较短,如果我们问的问题与提炼出来的问题相似那么它就会比较精准,生成的问题是通过大模型搞的,所以问题的合适性无法控制,这种的索引使用的不是很多
SXJR19 天前
java·spring boot·后端·大模型·milvus·rag·langchain4j
spring boot + langchain4j +milvus实现向量存储我在gitee上有整体的项目示例,有兴趣的可以拉下来看看:https://gitee.com/JR542784/langchain4j-test,如果不知道怎么部署milvus可以从我的主页走索milvus有相关的说明
deephub19 天前
人工智能·机器学习·kmeans·聚类·rag
Flash-KMeans:快速且内存高效的精确 K-Means,可在单张 GPU 进行亿级数据的聚类在当前的人工智能领域LLM 及其生成能力几乎独占了所有焦点。但再精密的 RAG Pipeline,能力上限也取决于那个沉默的引擎:搜索与聚类层。 聚类不只是一项经典的数据科学任务,它是组织高维向量空间的核心机制——让 LLM 能在数十亿条文档和参数的海洋中定位正确的记忆。随着数据集规模持续扩大,沿用数十年的标准算法已经撞上了墙。