收藏备用!2026 年所有主流 RAG 开源项目都在这里了

本文按核心框架、向量数据库、嵌入模型、文档处理、检索增强、评估工具、GraphRAG、低代码平台、Agentic RAG九大维度,整理2026年RAG技术生态的主流开源项目,便于快速选型与落地。

一、核心RAG框架(全流程编排)

项目名称 GitHub星数 核心优势 适用场景 开源协议 GitHub地址
LangChain 98K+ 700+集成,多Agent工作流,动态检索链路 复杂多步骤AI应用,企业级RAG系统 MIT github.com/langchain-a...
LlamaIndex 40K+ 数据特化型RAG,结构化查询,复杂检索模式 文档密集型应用,知识图谱集成 MIT github.com/run-llama/l...
Haystack 2.x 18K+ 模块化架构,生产级流水线,企业级部署 大规模文档问答,检索排序优化 Apache-2.0 github.com/deepset-ai/...
RAGFlow 79.6K+ 可视化工作流,融合RAG+Agent,多模态支持 快速原型开发,企业知识库 Apache-2.0 github.com/infiniflow/...
Dify 55K+ 无代码/低代码,可视化编辑器,一键部署 快速搭建RAG应用,业务人员使用 MIT github.com/langgenius/...
AnythingLLM 35K+ 轻量级UI,文档上传即聊天,Docker部署 个人/团队知识库,快速检索 MIT github.com/Mintplex-La...
OpenRAG 5K+ 模块化轻量级,可扩展,易定制 研究与实验,定制化RAG系统 Apache-2.0 github.com/linagora/op...
Youtu-RAG 8K+ Agent驱动,长期记忆,跨会话关联 智能客服,个性化推荐 Apache-2.0 github.com/TencentClou...
RAGLAB 3K+ 研究导向,算法对比,模块化架构 RAG算法研究,公平性能测试 MIT github.com/facebookres...

二、向量数据库(核心记忆层)

项目名称 核心特性 规模支持 部署方式 开源协议 GitHub地址
Milvus 云原生架构,存储计算分离,十亿级向量 10亿+ 分布式/K8s Apache-2.0 github.com/milvus-io/m...
Qdrant 点积/余弦/欧氏距离,动态索引,过滤条件丰富 亿级 单机/分布式 Apache-2.0 github.com/qdrant/qdra...
Weaviate 语义搜索,图结构集成,自动分片 亿级 单机/分布式 BSD-3-Clause github.com/weaviate/we...
ChromaDB 轻量级,内存优先,零依赖部署 百万级 本地/嵌入式 Apache-2.0 github.com/chroma-core...
pgvector PostgreSQL插件,关系+向量混合查询 百万级 数据库扩展 PostgreSQL github.com/pgvector/pg...
FAISS Facebook开发,高性能,GPU加速 十亿级 本地库/服务 MIT github.com/facebookres...
Zilliz Cloud Milvus托管版,Serverless 按需扩展 云服务 商业/开源混合 github.com/zilliztech/...

三、嵌入模型(文本表征)

模型名称 发布机构 特点 开源协议 GitHub地址
BGE-M3 智谱AI 多粒度,多任务,中文优化 MIT github.com/FlagOpen/Fl...
E5 微软 检索优先,长文本支持 MIT github.com/microsoft/u...
all-MiniLM-L6-v2 Sentence-BERT 轻量级,速度快 MIT github.com/UKPLab/sent...
Llama-2-7b-chat-hf Meta 大模型嵌入,上下文理解强 Llama 2 huggingface.co/meta-llama/...
Mistral-7B-v0.3 Mistral AI 高效,多语言,低延迟 Apache-2.0 github.com/mistralai/m...
jina-embeddings-v2-base-en Jina AI 长文本(8k),检索精度高 Apache-2.0 github.com/jina-ai/jin...

四、文档处理工具(解析/分割/加载)

工具名称 功能 支持格式 特点 GitHub地址
Unstructured 文档解析 PDF/Word/PPT/HTML等 智能提取,布局感知 github.com/Unstructure...
PyPDF2 PDF解析 PDF 轻量级,文本提取 github.com/py-pdf/PyPD...
LangChain Document Loaders 多源文档加载 网页/数据库/云存储等 70+加载器 github.com/langchain-a...
LlamaHub 数据连接器 200+数据源 一键集成,低代码 github.com/run-llama/l...
RecursiveCharacterTextSplitter 文本分割 所有文本 递归分割,保持语义 github.com/langchain-a...
SemanticChunker 语义分割 长文本 基于嵌入相似度,语义完整 github.com/langchain-a...

五、检索增强工具(重排/过滤/生成)

工具名称 功能 技术原理 适用场景 GitHub地址
Cohere Rerank 检索结果重排 交叉编码器 提升Top-K精度 github.com/cohere-ai/r... (开源SDK)
ColBERT 上下文感知检索 交互式BERT 长文档精准匹配 github.com/stanford-fu...
Contriever 稠密检索 对比学习 大规模文档检索 github.com/facebookres...
FlashRank 快速重排 轻量级模型 低延迟场景 github.com/Prithiviraj...
Rerankers 多模型重排 集成多种交叉编码器 混合检索系统 github.com/allenai/rer...
LLM-as-a-Judge 结果评估 大模型评分 检索质量判断 github.com/langchain-a...

六、GraphRAG(图结构检索增强)

项目名称 星数 核心能力 适用场景 GitHub地址
Microsoft GraphRAG 31K+ 社区检测,多跳推理,全局语义分析 金融投顾,新闻摘要 github.com/microsoft/g...
LightRAG 29K+ 轻量级图结构,动态构建,高效检索 知识图谱问答,快速原型 github.com/lightrag-ai...
KAG (OpenSPG) 8K+ 知识图谱推理,语义关联,复杂查询 企业知识管理 github.com/OpenSPG/ope...
NebulaGraph 12K+ 分布式图数据库,毫秒级查询 大规模知识图谱 github.com/vesoft-inc/...
Neo4j RAG 10K+ 图数据库集成,Cypher查询 关系密集型应用 github.com/neo4j/neo4j...

七、RAG评估工具(质量/性能/成本)

工具名称 评估维度 特点 GitHub地址
RAGAs 答案相关性,事实一致性,检索精度 轻量级,可扩展 github.com/explodinggr...
DeepEval 自定义指标,LLM评估,人类标注 全面评估框架 github.com/confident-a...
TruLens 可解释性,性能监控,成本分析 端到端监控 github.com/truera/trul...
LangChain Evaluation 内置指标,自定义评估器 与LangChain无缝集成 github.com/langchain-a...
LlamaIndex Evaluation 检索质量,生成质量,综合评分 数据导向评估 github.com/run-llama/l...

八、低代码/可视化RAG平台

平台名称 特点 部署方式 适用人群 GitHub地址
Dify 可视化编辑器,一键部署,多模型支持 Docker/K8s 业务人员,开发者 github.com/langgenius/...
RAGFlow 拖拽式工作流,多模态支持,权限管理 Docker/云原生 企业团队,快速开发 github.com/infiniflow/...
AnythingLLM 极简UI,文档上传即聊天,本地部署 Docker/本地 个人/小团队 github.com/Mintplex-La...
Verba Weaviate原生,语义搜索,聊天界面 Docker Weaviate用户 github.com/weaviate/Ve...
Cognita 企业MLOps,合规知识库,权限控制 云/本地 企业级应用 github.com/cognita-ai/...

九、Agentic RAG(智能体驱动RAG)

项目名称 核心能力 智能体类型 适用场景 GitHub地址
LangGraph 状态管理,多Agent协作,循环执行 规划/执行/评估 复杂推理任务 github.com/langchain-a...
EDDI 配置驱动,多Agent编排,企业合规 对话/工具调用 企业级AI助手 github.com/labsai/EDDI
Youtu-RAG 长期记忆,跨会话关联,个性化 规划/执行/记忆 智能客服,个性化推荐 github.com/TencentClou...
AutoGPT 自主任务执行,工具调用,内存管理 自主智能体 复杂信息收集 github.com/Significant...
MetaGPT 团队协作,角色分配,任务拆解 多角色智能体 软件开发,项目管理 github.com/geekan/Meta...

十、选型指南(快速匹配)

应用场景 推荐框架 推荐向量数据库 推荐嵌入模型 备注
企业级知识库 Haystack/RAGFlow Milvus/Qdrant BGE-M3/E5 注重可扩展性和安全性
个人/小团队 Dify/AnythingLLM Chroma/pgvector all-MiniLM-L6-v2 快速部署,低维护成本
研究/实验 LlamaIndex/RAGLAB FAISS/Chroma 自定义模型 灵活定制,算法对比
多跳推理/知识图谱 Microsoft GraphRAG NebulaGraph/Neo4j BGE-M3 图结构增强检索
低代码/无代码 Dify/RAGFlow 托管向量数据库 托管嵌入模型 业务人员友好
Agent驱动应用 LangGraph/Youtu-RAG Milvus E5/BGE-M3 状态管理,长期记忆

总结

2026年RAG技术生态已形成全栈开源体系,从核心框架到细分工具全面覆盖。选择时建议:

  1. 明确应用场景(企业级/个人/研究)
  2. 评估技术需求(可扩展性/检索精度/开发效率)
  3. 考虑团队技能(低代码/全栈开发)
  4. 优先选择活跃社区和长期维护的项目
相关推荐
yzx9910131 小时前
递归算法入门:像俄罗斯套娃一样思考
人工智能·算法
GEO从入门到精通1 小时前
在哪里能买到GEO学习工具或课程?
人工智能·学习
测试员周周1 小时前
【Appium 系列】第14节-断言与验证 — Validator 的设计
android·人工智能·python·功能测试·ios·单元测试·appium
AI人工智能+电脑小能手1 小时前
【大白话说Java面试题 第69题】【JVM篇】第29题:GC Roots 有哪些?
java·开发语言·jvm·面试
小白|1 小时前
tensorflow:昇腾CANN的TensorFlow适配层
人工智能·python·tensorflow
武汉唯众智创1 小时前
全栈物联网实训平台拆解:通信协议+边缘AI+实战源码
人工智能·物联网·嵌入式开发·物联网实训平台·高校实训·python物联网
码点滴1 小时前
CRI-O选型与容器运行时标准
开发语言·人工智能·架构·kubernetes·cri-o
一起聊电气1 小时前
智能断路器:守护智能照明系统的AI电气安全闸门
网络·人工智能·安全
莱歌数字1 小时前
电池-底盘一体化的热均匀性:集成时代的“均温难题”
人工智能·科技·汽车·制造·cae