rag

SXJR2 小时前
java·spring boot·后端·大模型·milvus·rag·langchain4j
spring boot + langchain4j +milvus实现向量存储我在gitee上有整体的项目示例,有兴趣的可以拉下来看看:https://gitee.com/JR542784/langchain4j-test,如果不知道怎么部署milvus可以从我的主页走索milvus有相关的说明
deephub3 小时前
人工智能·机器学习·kmeans·聚类·rag
Flash-KMeans:快速且内存高效的精确 K-Means,可在单张 GPU 进行亿级数据的聚类在当前的人工智能领域LLM 及其生成能力几乎独占了所有焦点。但再精密的 RAG Pipeline,能力上限也取决于那个沉默的引擎:搜索与聚类层。 聚类不只是一项经典的数据科学任务,它是组织高维向量空间的核心机制——让 LLM 能在数十亿条文档和参数的海洋中定位正确的记忆。随着数据集规模持续扩大,沿用数十年的标准算法已经撞上了墙。
四六的六5 小时前
前端·实战·个人开发·webview·ai大模型·rag·webview内嵌开发
WebView里跑RAG——浏览器内知识检索增强实战说真的,一开始想到要在 WebView 里跑 RAG,我自己都觉得这想法有点疯。不是那种常规的“客户端请求后端 API,后端做向量检索和大模型调用”的套路,而是把整套检索增强生成都塞进一个 WebView 里面。没错,包括 embedding 模型、向量库、甚至一个小到能跑在浏览器里的生成模型,全都丢进去,在用户手机上离线跑。听起来像自虐,但需求就那么奇葩:一个嵌入到 App 里的知识库问答模块,要求数据不出客户端,断网也能用,响应还要快。
Attachment George7 小时前
python·ai·langchain·kotlin·rag
山东大学软件学院-项目实训-个人开发日志(十):材料问答链路开发——文档解析、OCR兜底与持续追问完善前几周我已经把BabyMind的统一问答入口、RAG知识库、多Agent流式问答、语音输入输出等核心链路逐步打通。本周我的工作重点是把上传材料后直接提问等相关功能实现完整。
knight_9___7 小时前
人工智能·python·agent·rag·mcp
AI Agent 是什么?LLM,全称 Large Language Model,翻译过来就是大语言模型。你可以把它想象成一个读了互联网上几乎所有文字的超级学霸。它通过学习海量的文本数据,掌握了人类语言的各种规律和知识。我们平时用的 ChatGPT、Claude、DeepSeek、文心一言,底层都是大语言模型。
程序员三明治7 小时前
java·人工智能·后端·llm·元数据·rag·向量化
【AI】从文本到向量:理解Embedding的作用到这一步,知识库里的每个 chunk 已经有了清晰的上下文信息。但还有一个核心问题没有解决:这些内容仍然是自然语言,计算机并不能真正理解它们的含义。
不爱洗脚的小滕1 天前
人工智能·aigc·ai编程·rag
【Agent】如何为 AI Agent 设计高可用的 Tools在构建基于大语言模型(LLM)的智能体(Agent)系统时,开发者往往最关注模型的推理与决策能力。然而,大模型本身是一个“纯文本世界”的产物,它无法直接与外部数据库、操作系统、企业私有 API 或第三方服务进行交互。
Tbisnic1 天前
人工智能·ai·大模型开发·rag·coze
AI大模型学习第十三天:让AI学会查资料、记数据、看图和听声如果你已经读完了上篇博客,你应该已经知道:智能体 = 大模型的大脑 + 工具的手脚,你也学会了用工作流和插件让AI能联网搜索、读取文档。
老陈聊架构1 天前
ai·langchain·pdf·rag·opendataloader
『AI大模型』OpenDataLoader PDF 实战:RAG 知识库 PDF 解析与LangChain 接入📣读完这篇文章里你能收获到做 RAG 知识库的时候,很多人第一反应是:模型换强一点、向量库换高级一点、Embedding 再调一调。
不爱洗脚的小滕1 天前
架构·aigc·ai编程·rag
【Agent】ReAct 核心架构与设计哲学在构建大语言模型(LLM)应用的实际业务场景中,开发者往往会面临两个致命的痛点:如何让大模型既具备“聪明的头脑”去思考,又拥有“强壮的四肢”去感知和改变外部世界?
啾啾Fun2 天前
ai·llm·系统设计·rag
【LLM应用可靠性】2-RAG 生产失败模式:如何避免检索生成系统的性能退化许多 RAG(检索增强生成)系统在上线初期检索准确且响应迅速,但在运行一段时间后,可能会面临检索偏离、引用失效以及运行成本增加等问题。本文将系统梳理 RAG 在生产环境中的 12 大痛点与 9 种典型失败模式,并提供对应的工程治理方案。
是上好佳佳佳呀2 天前
笔记·langchain·rag
【LangChain|Day04】RAG 全流程基础笔记:Document 、 Loader 和 Splitter大家好,我是上好佳佳佳呀。今天我们开始拆解 LangChain 里那条最经典的 RAG 流程。今天的学习内容从Document 对象开始,到上游流程的 Loader 和 Splitter 是怎么一步一步把原始文档变成可检索的小块。我们把这些环节理顺,后面再去学习和串联 Embedding、VectorStore 和 Retriever 就会从容许多啦,那我们开始吧~
kisdiem3 天前
embedding·rag
Embeddings 到底是什么在普通程序里,文字首先只是字符串。字符串可以做精确匹配,却很难直接回答“这两句话是不是在说同一件事”。 例如,“怎样重置登录密码”和“我忘记密码了”几乎没有相同词汇,但人一眼就能看出它们高度相关。
枫子有风3 天前
面试·职场和发展·llm·rag
LLM-RAG(大厂面试常问问题)RAG 是什么?为什么需要 RAG? RAG 的完整链路是怎样的? 向量检索的原理是什么? 向量数据库怎么选?Milvus、FAISS、Qdrant 各自适合什么场景? 纯向量检索有什么问题?为什么需要混合检索? Rerank 是什么?为什么检索之后还要重排序? Chunk 怎么切?切大了切小了各有什么问题? Embedding 模型怎么选?中文场景选什么? RAG 的幻觉怎么处理? RAG 检索效果不好怎么优化? Agentic RAG 是什么?和普通 RAG 有什么区别?
逻极4 天前
架构·llm·agent·rag·多智能体系统·hermes agent·hermes
Hermes Agent深度探索:一个会自我沉淀经验的终端智能体第一次打开 Hermes Agent,很多人会把它归类成“带工具调用的命令行 AI 助手”。这个判断并不算错,但它只描述了最外层的使用体验。真正深入源码之后,你会发现它更像一个面向长期运行的 Agent 运行时——模型只是其中一个组件,工具、会话、记忆、技能、插件、安全策略、多平台入口和状态恢复共同构成了完整系统。
染指11104 天前
langchain·rag
24.RAG进阶(Advanced RAG)-摘要索引内容参考于:图灵AI大模型全栈摘要索引原理是先把文档进行分片,然后把分片的内容使用大模型进行生成摘要,然后放到向量数据库中,然后比如分片之后有100个,就创建100个唯一的id(跟身份证一样,由数字、字母组成),然后分别对100个摘要数据和100个分片之后的原文数据进行绑定,也就是说一个id绑定一个摘要一个原文,摘要放到向量数据库中用来做问题的搜索,就是说输入问题后先通过向量搜索摘要,找到摘要后,通过id去获取对于的原文,然后把原文带着问题去问大模型获取答案
没有腰的嘟嘟嘟4 天前
ai·llm·agent·rag·skill·spring ai·mcp
Easy-agent介绍目前,我的工作主要聚焦于 Agent 和 SKILL 相关领域。随着公司多个项目完成 Agent 化升级,我将项目集成 Agent 架构的经验进行总结和封装,最终开发出一个可复用组件——Easy-agent。
Ajie'Blog4 天前
javascript·人工智能·安全·rpc·json·rag
2026年AI安全与治理:从幻觉到系统性欺骗的攻防之战2026年,AI安全已从技术问题上升为全球性治理议题。随着大模型能力的不断提升,安全风险也从简单的"幻觉"问题演变为更隐蔽的"系统性欺骗"。本文深入剖析AI安全的新挑战、攻防技术以及全球治理框架。
质造者5 天前
linux·人工智能·python·langchain·rag
LangChain + Ollama + Tavily 实现旅游问答系统最近在学习 LangChain 框架和本地大模型 Ollama,动手写了一个景点 + 天气问答小项目。项目功能简单,主要用来练手 LangChain 常用组件、分支路由、并行调用等基础知识点,全程本地运行,不用额外付费,适合新手跟着敲代码学习。
质造者5 天前
开发语言·python·pdf·大模型·rag
Python 本地 RAG 实战 | Ollama+ChromaDB 实现 PDF 离线智能问答标签:Python、RAG、大模型、Ollama、ChromaDB、本地知识库检索增强生成(RAG)是当前大模型落地应用最主流的方案。本项目全程本地离线运行,无需调用任何云端 API,不受 Token 额度限制,同时能有效保护本地文档隐私。