rag

阿拉斯攀登1 小时前
数据库·elasticsearch·milvus·知识库·rag·个人知识库
向量数据库选型:Milvus vs Chroma vs ElasticsearchEmbedding 模型选好了,接下来第二个关键选型:往哪存这些向量?市面上的向量数据库少说也有十几个。我把最主流的三个——Chroma、Milvus、Elasticsearch——跑了一遍同条件的性能测试,今天给你一个不带废话的选型指南。
特别关注外国供应商3 小时前
人工智能·专利·rag·genai·ai工具·gaia·cohesity
Cohesity 获得 第 12,619,501 号专利,该专利涵盖了其企业数据生成式人工智能平台 Cohesity Gaia™ 的基础技术Cohesity 宣布,美国专利商标局 (USPTO) 已授予该公司第 12,619,501 号专利,该专利涵盖了其企业数据生成式人工智能平台 Cohesity Gaia™ 的基础技术。该专利名为“使用嵌入技术检索备份系统中的数据”,于 2026 年 5 月 5 日颁发,涵盖了 Cohesity 的专有方法,该方法将辅助数据系统与检索增强生成 (RAG) 语义层相结合,从而为 GenAI 应用提供支持。Cohesity 是首家获得此方法专利的数据保护供应商,该方法使企业能够在不创建新的数据孤岛、不削弱治理
CCPC不拿奖不改名5 小时前
linux·服务器·数据库·redis·深度学习·缓存·rag
Redis 工程化部署深度解析📖 本文档定位:本文是 Redis数据库工程化部署安装流程.md 的配套解析文档。部署流程文档回答「怎么做」,本文档回答「为什么这么做、每条命令的原理是什么、不这么做会怎样」。
小折耳猫_5 小时前
大模型·rag·智能体
大模型技术路线及场景选型指南核心目标:搞懂大模型是什么、能做什么、怎么选1. 大模型基础概念:通用大模型:GPT、Qwen、Llama、DeepSeek等
毒爪的小新6 小时前
linux·人工智能·ai·milvus·rag
踩坑实录 | RAG知识库完整搭建-Milvus2.4+BGE大中文AI模型嵌入RAG(Retrieval-Augmented Generation,检索增强生成)在2020年被首次提出,是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息,并将其作为提示(prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力。
带刺的坐椅9 小时前
java·ai·llm·solon·rag·chatmodel
用 ChatModel 构建 LLM 驱动的 Java 应用如果你尝试过在 Java 应用中集成大语言模型(LLM),大概率写过不少样板代码:HTTP 客户端、JSON 解析、流式处理、会话管理……Solon 4.0 的 ChatModel 用一套简洁的 Builder API 把这些都封装好了。
leonshi1 天前
ai·rag·ollama
使用embedchain快速建立rag知识库,本地大模型初学RAG搭建知识库,强烈建议先利用embedchain这个开源的RAG框架,短短几行代码就能让你快速建立一个私人知识库,并支持随时增加知识源,是理想的学习和使用RAG知识的开源利器
秋名山码民17 天前
大数据·人工智能·rag
Graph RAG 深度解析:从向量检索到知识推理的技术演进在 RAG 领域深耕的这两年,我们走过了三段技术迭代之路:从最初的向量检索 RAG,到多智能体协同 RAG,再到目前聚焦落地的 Graph RAG。每一次技术升级,都是为了解决上一代架构的核心瓶颈,每一步演进都在朝着「让 AI 真正理解知识、而非匹配文本」的核心目标靠近。本文是我们团队完整的技术演进阶段性总结,将重点深度拆解 Graph RAG 的原理、架构、落地难点与解决方案,同时清晰梳理我们从传统向量 RAG 迭代至 Graph RAG 的完整思考路径。
Artech17 天前
ai·agent·rag·maf
[MAF预定义的AIContextProvider-01]TextSearchProvider——RAG在MAF中的实现作为最核心的AIAgent,ChatClientAgent构建了一个管道与LLM交互。为了让管道的输出更符合我们的需求,有两个主要的途径:输入增强(Input Enhancement)和输出增强(Output Enhancement),前者通过通过改变输入让LLM返回更高质量的内容,后者则直接对LLM的输出进行加工处理。个注册的AIContextProvider组成的管道位于ChatClientAgent管道的中间件部分(前后分别是AIAgent中间件管道和ChatClient管道),是专门为输入和输出增
染指111018 天前
人工智能·windows·agent·rag·advanced rag
26.RAG进阶(Advanced RAG)-假设性问题索引内容参考于:图灵AI大模型全栈假设性问题索引做的事情对文档内容(切分之后的文档),提炼出三个问题,把提炼出来的问题转成向量存到数据库,然后比对的数据就是问题,转换成问题后语意会比较短,如果我们问的问题与提炼出来的问题相似那么它就会比较精准,生成的问题是通过大模型搞的,所以问题的合适性无法控制,这种的索引使用的不是很多
SXJR18 天前
java·spring boot·后端·大模型·milvus·rag·langchain4j
spring boot + langchain4j +milvus实现向量存储我在gitee上有整体的项目示例,有兴趣的可以拉下来看看:https://gitee.com/JR542784/langchain4j-test,如果不知道怎么部署milvus可以从我的主页走索milvus有相关的说明
deephub18 天前
人工智能·机器学习·kmeans·聚类·rag
Flash-KMeans:快速且内存高效的精确 K-Means,可在单张 GPU 进行亿级数据的聚类在当前的人工智能领域LLM 及其生成能力几乎独占了所有焦点。但再精密的 RAG Pipeline,能力上限也取决于那个沉默的引擎:搜索与聚类层。 聚类不只是一项经典的数据科学任务,它是组织高维向量空间的核心机制——让 LLM 能在数十亿条文档和参数的海洋中定位正确的记忆。随着数据集规模持续扩大,沿用数十年的标准算法已经撞上了墙。
四六的六18 天前
前端·实战·个人开发·webview·ai大模型·rag·webview内嵌开发
WebView里跑RAG——浏览器内知识检索增强实战说真的,一开始想到要在 WebView 里跑 RAG,我自己都觉得这想法有点疯。不是那种常规的“客户端请求后端 API,后端做向量检索和大模型调用”的套路,而是把整套检索增强生成都塞进一个 WebView 里面。没错,包括 embedding 模型、向量库、甚至一个小到能跑在浏览器里的生成模型,全都丢进去,在用户手机上离线跑。听起来像自虐,但需求就那么奇葩:一个嵌入到 App 里的知识库问答模块,要求数据不出客户端,断网也能用,响应还要快。
Attachment George18 天前
python·ai·langchain·kotlin·rag
山东大学软件学院-项目实训-个人开发日志(十):材料问答链路开发——文档解析、OCR兜底与持续追问完善前几周我已经把BabyMind的统一问答入口、RAG知识库、多Agent流式问答、语音输入输出等核心链路逐步打通。本周我的工作重点是把上传材料后直接提问等相关功能实现完整。
knight_9___18 天前
人工智能·python·agent·rag·mcp
AI Agent 是什么?LLM,全称 Large Language Model,翻译过来就是大语言模型。你可以把它想象成一个读了互联网上几乎所有文字的超级学霸。它通过学习海量的文本数据,掌握了人类语言的各种规律和知识。我们平时用的 ChatGPT、Claude、DeepSeek、文心一言,底层都是大语言模型。
程序员三明治18 天前
java·人工智能·后端·llm·元数据·rag·向量化
【AI】从文本到向量:理解Embedding的作用到这一步,知识库里的每个 chunk 已经有了清晰的上下文信息。但还有一个核心问题没有解决:这些内容仍然是自然语言,计算机并不能真正理解它们的含义。
不爱洗脚的小滕19 天前
人工智能·aigc·ai编程·rag
【Agent】如何为 AI Agent 设计高可用的 Tools在构建基于大语言模型(LLM)的智能体(Agent)系统时,开发者往往最关注模型的推理与决策能力。然而,大模型本身是一个“纯文本世界”的产物,它无法直接与外部数据库、操作系统、企业私有 API 或第三方服务进行交互。
Tbisnic19 天前
人工智能·ai·大模型开发·rag·coze
AI大模型学习第十三天:让AI学会查资料、记数据、看图和听声如果你已经读完了上篇博客,你应该已经知道:智能体 = 大模型的大脑 + 工具的手脚,你也学会了用工作流和插件让AI能联网搜索、读取文档。
老陈聊架构19 天前
ai·langchain·pdf·rag·opendataloader
『AI大模型』OpenDataLoader PDF 实战:RAG 知识库 PDF 解析与LangChain 接入📣读完这篇文章里你能收获到做 RAG 知识库的时候,很多人第一反应是:模型换强一点、向量库换高级一点、Embedding 再调一调。
不爱洗脚的小滕19 天前
架构·aigc·ai编程·rag
【Agent】ReAct 核心架构与设计哲学在构建大语言模型(LLM)应用的实际业务场景中,开发者往往会面临两个致命的痛点:如何让大模型既具备“聪明的头脑”去思考,又拥有“强壮的四肢”去感知和改变外部世界?