GitHub 上 Star 数量前 18 的开源 AI Agent 项目

原文链接：GitHub 上 Star 数量前 18 的开源 AI Agent 项目 - NocoBase。

大概一个多月前，我在 Hacker News 上刷到一篇讨论热度很高的文章------《停止构建 AI Agent》。

作者在文中分享了自己的亲身经历：他用 CrewAI 组建了一个"研究小组"------三名 Agent、五个工具，纸面上分工完美无缺。但真正运行时，研究员 Agent 无视爬虫工具，摘要员忘记引用，协调员在处理长文档时直接放弃，原本看似天衣无缝的方案，在实践中却像多米诺骨牌般接连失灵。

下面这张流程图，是作者在经历无数次代理系统的调试与翻车后，总结出的"是否该用 Agent"的经验指南。

Image source: decodingml.substack.com/p/stop-buil...

文章提炼出一个重要原则：Agent 最适合在"人类参与监督"的非稳定型流程中发挥作用------这种场景下，Agent 的探索能力和创造性往往优于工作流。

可用场景：数据科学助手（自动写 SQL、生成可视化、探索数据趋势）；创意写作伙伴（头脑风暴、文案改进）；代码重构助手（提出优化建议、发现潜在问题）。在这些任务中，人类可随时评估结果并纠正偏差。
不建议使用：企业核心自动化（关键业务流程的稳定性无法交给 LLM 决定）；高风险决策（金融交易、医疗诊断、法律合规等需要确定性逻辑的领域）。

Image source: decodingml.substack.com/p/stop-buil...

如果看完上面的内容，你依然觉得自己的业务场景适合构建 Agent，那么这篇文章将为你盘点 GitHub 上Agent 话题下 Star 数排名前 18 的开源项目，并从项目概览、核心功能与应用场景三个维度剖析它们的优势与边界，帮助你在合适的场景中发挥 Agent 的最大价值。

💬 欢迎来到 NocoBase 的博客。NocoBase 是一个开源无代码/低代码开发平台，用于构建企业级应用、内部工具和流程系统，支持自托管，插件化设计，开发者友好。→ 在 GitHub 上了解更多

💡 也欢迎阅读我们往期最受欢迎的 GitHub 项目系列文章（部分项目会在不同主题中重复出现）：

No.1: Dify

GitHub Star: 110k
GitHub: github.com/langgenius/...
Website: dify.ai/

项目概览：

Dify 是一个开源的 LLM 应用开发平台。它融合了直观可视化界面、RAG 工作流、Agent 能力、模型管理与全链路可观测性，让开发者能够迅速搭建、调试并部署 AI 应用。

核心功能：

可视化工作流编排：提供拖拽式构建界面，开发者可以在画布上设计并测试复杂的 AI 流程，包括提示、模型调用与任务串联等。
RAG 管道支持：支持多格式文档（如 PDF、PPT）摄入，自动抽取内容并构建检索管道，实现知识增强生成能力。
全模型生态与提示编辑器：兼容 GPT、Mistral、Llama3 及所有 OpenAI API 兼容模型，一站式管理模型与调优提示，简化模型切换与性能比对流程。

应用场景：

构建智能客服与 QA 系统
对接企业知识库
快速部署内容生成工具

No.2: Lobe Chat

GitHub Star: 64.3k
GitHub: github.com/lobehub/lob...
Website: lobechat.com/

项目概览：

Lobe Chat 是一个开源的多模型聊天与应用平台，强调 UX 体验，支持语音、视觉识别、多模态输入、插件市场、移动端适配和多用户管理。

核心功能：

多模态 & 插件支持：支持语音对话、图像识别与生成，并通过插件市场扩展功能，满足多样交互需求。
智能体指数平台：通过一个社区驱动的索引，用户可浏览、添加或提交自定义助手，便于扩展和复用。
统一模型适配：提供统一接口与插件化架构，轻松衔接 OpenAI、Anthropic、Gemini、Ollama 等模型服务商，便于平台迁移与模型升级。

应用场景：

快速搭建高交互、多模态的智能聊天应用
部署领域定制助手

No.3: RAGFlow

GitHub Star: 62.1k
GitHub: github.com/infiniflow/...
Website: ragflow.io/

项目概览：

RAGFlow 是一款基于深度文档理解的开源 RAG 引擎，旨在为企业与个人提供高质量、可解释的问答与 Agent 服务。它不仅能处理复杂格式文档，还能提供引用性回复与可视化块管理。

核心功能：

深度文档理解：擅长解析 PDF、Word、PPT、Excel、图片等非结构化内容，提取可检索信息块，确保生成内容真实、可验证。
RAG 问答与引用追踪：结合向量检索与 LLM，生成带引用的回答，并支持手动调整检索块以优化准确度。
灵活部署与集成：提供 Docker Compose 部署方式，可与各类 LLM 集成。

应用场景：

构建文档驱动的问答系统与知识助手
实施内容审核与引用追踪
部署支持复杂文件结构的 RAG 应用

No.4: OpenHands

GitHub Star: 62k
GitHub: github.com/All-Hands-A...
Website: all-hands.dev/

项目概览：

OpenHands 的核心理念是让 AI 能像人类开发者一样"写更少的代码，完成更多工作"，提供代码编辑、命令执行、网页浏览、API 调用等多种能力支持。

作为一个 MIT 开源项目，OpenHands 可以在本地通过 Docker 快速部署，也提供 OpenHands Cloud SaaS 版以便免配置上手，其中 Cloud 版本更提供初始使用额度，适合快速试用。随着版本更新，OpenHands 架构不断完善，逐步实现了通用 Agent 控制器、多 Agent 协同、多交互会话管理、沙箱安全执行等特性，成为一个针对软件开发者的通用 AI 工具平台。

核心功能：

通用开发者 Agent 能力：Agent 能执行"修改代码、运行命令、浏览网页、调用 API"等任务，模拟人类开发者的行为路径。
多 Agent 协作与会话管理：系统支持多个 Agent 协同工作，具备会话管理能力（Session、EventStream、AgentController 等），实现任务分工或协同处理复杂需求。
安全沙箱机制：Agent 执行代码和命令时，运行环境由沙箱（如 Docker 容器）隔离，确保执行安全，减少对宿主系统风险。

应用场景：

辅助开发者完成常规代码任务
自动化测试与部署流程
快速原型与工具搭建

No.5: MetaGPT

GitHub Star: 57.8k
GitHub: github.com/FoundationA...
Website: mgx.dev/

项目概览：

MetaGPT 是一个多智能体协作框架，强调"软件公司模拟"，将自然语言需求转化为从用户故事、竞品分析到 API 设计、文档编写的一整套流程。其核心理念是"Code = SOP(Team)"------将标准作业程序（SOP）具体化，安排产品经理、架构师、工程师等角色协作完成任务。

核心功能：

多角色智能体协作：内置产品经理、架构师、项目经理、工程师等 AI 智能体，模拟真实团队依照 SOP 协同推进项目。
SOP 驱动流程：通过标准作业程序指导每个 Agent 执行任务，实现任务拆解与结构化执行，减少偏差与幻觉。
自然语言编程：用户只需一句话描述需求，MetaGPT 即可生成对应的用户故事、数据结构、API 接口与架构设计。

应用场景：

自动生成软件项目开发提案
快速构建团队协作原型
探索 AI 驱动的软件开发流程优化与自动化研究

No.6: LLMs-from-scratch

GitHub Star: 56k
GitHub: github.com/rasbt/LLMs-...

项目概览：

LLMs-from-scratch 是一个从零实现大型语言模型的教学型项目，帮助开发者理解 LLM 的核心原理与训练过程。

👉 点击查看 LLMs-from-scratch 的完整介绍与应用场景

No.7: Huginn

GitHub Star: 47k
GitHub: github.com/huginn/hugi...

项目概览：

Huginn 是一个开源自动化工具，让用户可在自有服务器上运行 agents，从网络采集信息并基于条件进行触发动作，如邮件通知、关键词监控等。Huginn 的设计初衷有力捍卫了用户对数据的控制权，以其数据可控、自托管、可扩展代理系统特点长期活跃在开源社区。

核心功能：

自托管 Web 代理平台：用户可在自己的服务器上部署 agents，自主处理数据与执行任务，确保隐私与可控性。
事件---动作规则引擎：支持配置条件触发 logic，当指定的网络事件发生时，可以自动执行通知、脚本或 HTTP 调用等操作。
扩展性 Agents 机制：内置多种 agents，可通过 Huginn Agent gem 扩展自定义 agent 功能，生态丰富。

应用场景：

信息监控与提醒
数据抓取与自动化流程
自定义自动化工具构建

No.8: Unsloth

GitHub Star: 43.8k
GitHub: github.com/unslothai/u...
Website: docs.unsloth.ai/

项目概览：

Unsloth 是一款专为微调 LLM（如 OpenAI gpt-oss、Qwen3、Llama 4）而设计的开源工具，目标是提供更加高效且显存友好的训练流程。其核心代码采用 OpenAI 开发的 Triton 架构，显著提升训练速度并降低显存占用。

核心功能：

高效显存优化微调：在主流 LLM 上实现 1.5-2.2× 的微调速度提升，并减少高达 70--80% 的显存使用。
易用 Notebook 工作流：用户只需添加数据集并点击"Run All"即可完成模型微调，便可快速完成模型训练。
广泛模型兼容：支持微调包括 Llama、Gemma、Qwen 等多个 LLM 模型。

应用场景：

快速微调 LLM 模型用于研究或产品原型验证
教育与教学工具：让入门者在免费 GPU 环境中体验模型训练流程
高显存节省需求的开发场景，如部署在资源受限设备上

No.9: Mem0

GitHub Star: 38.1k
GitHub: github.com/mem0ai/mem0
Website: mem0.ai/

项目概览：

Mem0 是一款专为 AI Agent 设计的长期记忆管理系统，致力于解决 AI 常见的"遗忘"问题。它通过统一记忆层使智能体能够跨会话、跨应用持续保留用户偏好与历史上下文，实现个性化且连续的交互体验。在 LOCOMO 基准测试中，Mem0 相比 OpenAI Memory，在准确率上提升约 26%，响应延迟降低 91%，且 Token 消耗降低 90%。适合用于客服机器人、AI 助手和自主系统等需要上下文延续的场景。

核心功能：