rag

Flying pigs~~1 小时前
人工智能·开源·大模型·agent·dify·rag
Dify平台入门指南:开源LLM应用开发平台深度解析Dify是一款开源的LLM应用开发平台,融合了后端即服务(BaaS)的理念,让开发者可以快速搭建生产级的生成式AI应用。即使是非技术人员,也能参与到AI应用的定义和数据运营中。
SunnyRivers3 小时前
优化·rag·评估
RAG 评估与优化在本综合教程中,学习如何使用 LangChain 评估和优化 RAG(检索增强生成)系统。掌握 RAGAS 框架、A/B 测试策略、性能指标以及面向生产环境的 RAG 系统分步优化技术。
Java后端的Ai之路21 小时前
人工智能·python·langchain·rag·lcel
当大模型开始“水土不服“:从通才到专才的进化论——Fine-tuning 企业级实战全攻略对了,分享一个我最近常看的AI人工智能入门学习渠道,讲得挺有章法的,不端着也不故弄玄虚。不感兴趣划走就行,感兴趣的可以自己去验证一下。
大模型RAG和Agent技术实践1 天前
人工智能·dify·rag
项目实战:深入剖析 Dify 知识库管理系统的 RBAC 权限设计与实现前文发过一篇“深度集成Dify API:企业级RAG知识库管理平台解决方案”的文章,提供了基于Dify API 实现的一个企业级知识库管理平台。但是对于企业级需求,知识库的权限管理是不可或缺的,本项目就此在以前项目的基础上进一步提供了完整的 RBAC 权限管理体系,方便广大网友实际使用。
庄小焱2 天前
人工智能·ai·向量数据库·ai大模型·rag·rag索引·索引构建与优化
【AI模型】——RAG索引构建与优化本文系统介绍了RAG(检索增强生成)系统中的索引构建与优化技术。核心内容包括:向量嵌入(Embedding)的原理、发展历程及选型方法;多模态嵌入技术(以CLIP和bge-visualized-m3为例);向量数据库(FAISS、Milvus等)的工作机制与实战应用;以及两种关键索引优化策略——上下文扩展优化(句子窗口检索)和结构化索引优化。文章还探讨了LLM知识时效性、模型更新机制及框架选择等延伸问题,为构建生产级RAG系统提供完整技术指南。
庄小焱2 天前
ai·rag·ai模型·rag检索优化
【AI模型】——RAG检索优化混合检索(Hybrid Search)是一种结合了稀疏向量(Sparse Vectors) 和 密集向量(Dense Vectors) 优势的先进搜索技术。旨在同时利用稀疏向量的关键词精确匹配能力和密集向量的语义理解能力,以克服单一向量检索的局限性,从而在各种搜索场景下提供更准确、更鲁棒的检索结果。
深念Y2 天前
数据库·人工智能·neo4j·图论··向量·rag
图数据库 vs 向量数据库:AI时代的两个“最强大脑”一个管“关系”,一个管“相似”,别再傻傻分不清最近在开发一个AI Agent项目时,遇到了一个有趣的问题:用户问“找和我兴趣相似的朋友”和“找朋友的朋友的朋友”,这两个需求看起来都是“找人”,但背后的技术选型却完全不同。
Alice-YUE2 天前
前端·语言模型·rag
AI对话为什么需要RAG本质上是通过rag解决达模型回答不可靠的问题,前端的核心价值在于将检索结果结构化展示,并与流式生成过程融合。
给自己做减法2 天前
知识库·rag
知识库检索,ragdify知识库检索当使用dify的时候,发现可以通过文件等方式直接导入知识库,但是发现一个离奇的事情,就是导入的文档,直接搜素无法找到答案,查看文档后,发现文档被定义了一些关键字。 经过测试发现,只有按照关键字查找,才有办法找到知识库内容。 原来dify默认是采用经济类型,就是关键词检索(BM25)为主,0 token消耗,有点类似MySQL的精准命中。
念念不忘 必有回响3 天前
langchain·rag
RAG 入门第三课:给你的知识库装上大脑(基于LangChain与Qwen3.5的本地RAG系统搭建)在上一篇文章中,我们成功把 PDF 文档变成了向量,存进了 ChromaDB 这个“图书馆”。但这时候的数据库是“死”的——它只是一堆数字,不会说话。
庄小焱4 天前
大模型·rag·ai模型·ai系统·ai算法
【AI模型】——RAG技术简介与实战示例本文系统介绍了RAG(检索增强生成)技术,阐述其通过结合LLM参数化知识与外部非参数化知识解决大模型幻觉、知识滞后等问题的核心机制,对比了Naive/Advanced/Modular三阶段架构演进,并详细讲解了从数据准备、索引构建到检索优化的完整工程实践,包括文本分块策略、向量数据库选型及FAISS/rerank等关键优化方向。
SunnyRivers4 天前
大模型·rag·高级
高级 RAG 技术教程学习如何在本综合教程中使用 LangChain 实现高级 RAG 技术。逐步掌握多查询搜索、父子分块、重排序策略以及融合技术,以达到生产级别的准确度。
正在走向自律4 天前
langchain·向量数据库·rag·企业级架构
从0到1构建企业级RAG系统:基于LangChain+向量数据库的完整实战摘要:本文深入讲解了构建生产级RAG(检索增强生成)系统的完整方案。主要内容包括:1)系统架构设计,涵盖索引构建和查询处理全流程;2)向量数据库选型对比与Milvus实战部署;3)文档智能分块与向量化处理策略;4)查询优化技术,包括重写、扩展和混合检索;5)重排序优化与Cross-Encoder应用;6)完整API服务实现与Docker部署方案。文章重点分析了企业级RAG的核心挑战,如检索精度、系统性能和数据安全等,并提供了性能优化策略和演进路线建议。通过结合密集/稀疏向量检索、查询重写和重排序等技术,可
Flying pigs~~4 天前
数据库·人工智能·缓存·大模型·milvus·知识库·rag
从零到一构建企业级 RAG 问答系统:一个完整的模块化实践指南在人工智能技术飞速发展的今天,大语言模型(LLM)展现出了惊人的能力。然而,如何让 LLM 真正落地到垂直领域,解决实际问题,仍然是一个值得深入探讨的课题。RAG(Retrieval-Augmented Generation,检索增强生成)作为目前最成熟的解决方案之一,通过将外部知识库与 LLM 结合,有效解决了模型知识更新滞后、幻觉等问题。
Flying pigs~~4 天前
agent·milvus·rag·智能体·检索增强生成
RAG 项目完整学习笔记与总结这是一个生产级的多层 RAG 问答系统,核心特点:多级检索降级:Redis 缓存 → BM25 关键词检索 → Milvus 向量检索,层层递进
Flying pigs~~4 天前
人工智能·redis·mysql·docker·prompt·milvus·rag
企业级模块化RAG项目(mysql➕redis➕milvus➕模型微调➕bm25➕fastapi➕ollama➕Prompt➕多策略选择)一个完整的 RAG 系统涉及多个技术组件,每个组件的选型都直接影响系统的性能、成本和可维护性。本文档详细分析本项目各项技术选型的考量因素及竞品对比。
rising start4 天前
embedding·dify·rag
RAG入门与在Dify中的简单实践本文将带你完成 RAG 技术从理论到实战的全流程。我们以 长江科技有限公司内部知识库:新员工入职指南问答助手 为例,基于 Dify 平台进行实操演示,每一步都会给出具体的操作指引与最佳实践建议。
究极无敌暴龙战神X5 天前
自然语言处理·llama·rag
RAG基本流程RAG(Retrieval-Augmented Generation,检索增强生成)是一种将外部知识检索与大语言模型(LLM)生成能力相结合的技术,用于提升回答的准确性、减少“幻觉”(Hallucination),并支持私有或实时数据。
竹之却5 天前
人工智能·大模型·检索增强·faiss·rag
【Agent-阿程】AI先锋杯·14天征文挑战第14期-第6天-大模型RAG检索增强生成实战技术标签:人工智能、大模型、RAG、检索增强、LangChain、向量数据库、FAISS大模型训练数据存在时间截止点,无法获取训练后新增的知识,回答易出现过时、错误、幻觉。