rag

searchforAI5 分钟前
人工智能·gpt·ai·agent·rag·skill·claudecode
Agent Skills知识库检索比RAG强吗?技术原理拆解近一年里,AI知识库这个话题被聊烂了,但很多人没注意到,知识库检索这件事底下分了两条路:一条是传统 RAG(检索增强生成),另一条是最近越来越多产品在用的 Agent Skills 方式。两条路的实现逻辑差别很大,适合的场景也不一样。
Soari19 分钟前
microsoft·开源·github·markdown·rag
GitHub 开源项目解析:microsoft/markitdown —— 面向 LLM 的多格式文档转 Markdown 工具在大模型应用开发中,文档解析是一个绕不开的问题。无论是构建 RAG 知识库、企业文档问答、智能搜索,还是把 PDF、Word、PPT、Excel、网页、图片、音频等资料交给 LLM 分析,第一步通常都是:将各种复杂格式转换为模型更容易理解的文本。microsoft/markitdown 正是为这个场景设计的开源工具。
码luffyliu24 分钟前
java·agent·秋招·实习·rag·知识库系统
企业级多agent知识库系统|超值源码+资料MindCrew 智能知识平台 |企业级多 Agent 知识库系统|Agentic RAG+Multi-Agent+MCP|源码交付 一套基于 Agentic RAG + Multi-Agent Crew + MCP 的真正可以商用的企业级知识库系统,支持音频pdf等格式上传,还有音频溯源,性格设定,模型切换(可自定义添加模型)等。
lhxcc_fly18 小时前
langchain·llm·rag
6.LangChain--RAG当前对于大部分人来说我们利用LLM都是进行AI搜索来帮助我们进行知识的获取与总结。用一个租房项目的本地文件为知识库的一个案例演示。
lhxcc_fly18 小时前
langchain·llm·rag
6.1RAG--文档加载器LangChain ⽂档加载器可以将各种数据源加载成⼀系列的⽂档对象 DocumentMarkdown文档类型:
codefan※1 天前
人工智能·大模型·llm·知识图谱·neo4j·rag·graphrag
干掉幻觉实战:如何构建企业级知识图谱增强 RAG本文约 7200 字,读完大约需要 18 分钟如果你在生产环境部署过 RAG 系统,一定踩过这样的坑:
梁萌1 天前
ai·知识库·rag·检索·问答
LightRAG知识库https://github.com/HKUDS/LightRAGhttps://www.cnblogs.com/JentZhang/p/18801719
AI-Frontiers2 天前
rag
RAG系列:#6 一文搞懂RAG存储技术:文件、元数据、切片、向量原文链接:https://mp.weixin.qq.com/s/gs-yR2R-ZTJeYx0r2ow1PA
菜到离谱但坚持2 天前
python·langchain·prompt·rag
零门槛学LangChain:AI开发从入门到实战很多新手想学AI应用开发,却被大模型、向量数据库、链式调用这些名词劝退!今天用最通俗的大白话、零门槛思路,带你吃透LangChain核心知识,搭配可直接运行的实战代码,零基础也能轻松做出专属AI应用✨
Devin~Y2 天前
java·jvm·spring boot·redis·spring cloud·kafka·rag
智慧物流+AIGC客服Java大厂面试:Spring Boot、Kafka、Redis、JVM与RAG Agent实战小Y号称“八年Java经验,精通高并发、微服务、AI大模型落地”,今天来到某互联网大厂面试。面试岗位是:智慧物流与AIGC智能客服平台 Java 后端工程师。
小白狮ww2 天前
人工智能·知识库·多智能体·rag·ai学习工具·deeptutor·交互式学习
个人学习助手 DeepTutor:把论文检索、做题和学习规划一次打通别的不说,现在 AI 学习工具也开始卷出「家教界六边形战士」了。前脚还在手动整理笔记、翻论文、刷题找答案,后脚 DeepTutor 就直接把「学习」这件事做成了全自动流水线。
敲个大西瓜3 天前
rag
RAG(二)PGVector 是 PostgreSQL 的向量扩展,让 PostgreSQL 直接支持向量存储和相似度搜索。 PGVector 给 PostgreSQL 加了一个新的数据类型 VECTOR,可以在普通的表里加一列向量,然后对这列向量做相似度搜索。 运算符 距离类型 适用场景 <-> 欧氏距离(L2) 坐标空间,对向量幅度敏感 <=> 余弦距离 文本语义搜索首选,只看方向不看幅度 <#> 内积(负数) 向量已归一化时等效于余弦距离 文本 RAG 场景几乎都用余弦距离。原因是:不同长度的文本,Embedd
不爱洗脚的小滕3 天前
网络·langchain·milvus·rag
【RAG】Milvus 混合检索参数调优:ef / candidate_k / final_k 详解若两路各取 5 条,真正相关的结果 X 在稠密路排第 6,RRF 融合时根本看不到 X, 导致好结果被漏掉。candidate_k 放大后,X 参与融合,最终得分提升,有机会进入 top-k。
codefan※3 天前
知识图谱·milvus·faiss·向量数据库·rag·qdrant
RAG 加速指南:Faiss / Milvus / Qdrant 向量库选型与调优三大主流向量数据库深度实测,附 Docker 一键部署配置与性能调优参数向量数据库是 RAG(检索增强生成)系统的核心基础设施。当你的知识库从几千条增长到百万、千万级时,向量检索的性能瓶颈就会彻底拖垮你的 AI 应用响应速度。
abigale033 天前
缓存·langchain·prompt·token·rag·lcel
LangChain 实践4: 7个人AI助手全栈项目:完整拆解+分阶段开发指南本项目是一个从零搭建的全栈AI实战项目,覆盖大模型应用开发全链路核心技术。下文结合项目整体架构、功能模块与落地流程,拆解出7个递进式开发阶段,按照规划逐步开发,即可完成从本地调试到线上部署的完整流程。
程序员三明治3 天前
java·人工智能·后端·ai·大模型·llm·rag
【AI】RAG 数据分块(Chunk)策略与实践本文面向正在建设 RAG 知识库问答系统的开发者,围绕“为什么需要分块、如何设置 chunk_size 与 overlap、常见分块策略如何选择”展开说明。示例场景统一替换为在线教育平台的课程预约与教务服务知识库;技术链路、参数权衡和性能优化思路保持不变。
咖啡星人k3 天前
大数据·人工智能·架构·rag·mcp·百智云
长亭百智云:全新一代AI基础服务平台深度解读长亭百智云(baizhi.cloud)是由长亭科技推出的全新一代 AI 基础服务平台,定位为面向开发者和企业的一站式 AI 能力中心。平台目前提供 14 个在线产品,涵盖 API、模型、能力型服务等多种形态,可直接作为底层能力接入业务系统,帮助团队快速构建 AI 应用而无需从零搭建基础设施。
不爱洗脚的小滕3 天前
langchain·aigc·ai编程·rag
【RAG】召回(Retrieval)与重排(Rerank)核心技术要点汇总在检索增强生成(RAG)架构中,召回与重排处于不同的阶段,承担不同的职责:在工业级高并发场景中,禁止在业务代码中直接同步加载模型推理,主流做法分为两类:
deephub4 天前
人工智能·大语言模型·rag·视频分块
视频 RAG 中分块策略:基于停顿、滑动窗口与基于 LLM 的方法文本的RAG我们都已经很熟悉了,但是如果数据以原始视频转录文本的形式存储,没有合适的时间结构,那么相比标准的 PDF 或文本文档,如何检索视频里面的内容呢? 针对同样的问题还可以换一个更高层次的问法:
Maiko Star4 天前
人工智能·rag·springai
理解 RAG 的“为什么”与 Spring AI 实战初体验任何大模型都有两个硬伤,不解决就没法直接回答很多真实问题:训练截止日期 模型的知识来自训练数据,训练完成那一刻知识就凝固了。问它“上周的股价是多少”,答不了;问它“最新政策有什么变化”,也答不了。