想在AI 时代做点东西，GoHumanLoop阶段性总结

前言

上周我花了两天周末时间把GoHumanLoop官网做好，发布上线了 🎉🎉🎉

不知不觉已经做GoHumanLoop一段时间，是时候该做一个阶段性的总结了，趁着这个机会回答一下很多人问我的问题:

GoHumanLoop到底是什么？它在解决什么问题？

一. 事情起因

自从22年底GPT3.5出来后，一直都在跟着AI时代的潮流向前摸索，相信很多人也和我有一样想法，趁着这一轮AI浪潮早期，尽早下场看能赶得上车吗，毕竟人家说站在风口上猪都能飞起来。

所以我就开始了我的折腾，从做一些AI开源的项目，到做一款智能阅读产品「帝阅DeepRead」，一路不断总结和积累对这轮AI技术变革的理解，提高自己产品的认知能力。

今年三、四月份，在看到Manus在通用Agent领域的能力展示时，我突然有个思考💡，

随着Agent能力越来越强，场景复杂复杂度的提升，长程的任务必然会出现
云端AI Agent--无GUI的Agent，异步处理场景也将会出现

基于这种新技术下的人机交互该是如何一个形式呢？当AI作为我们智能伙伴在帮助我处理任务时，我和它是一个怎样的协同方式，来确保它的执行任务和我们想法对齐，确保可靠的执行和交付价值？

所以我想到我去做一个产品，去解决在AI Agent时代下的人机协同问题，这个产品至少要解决长程任务下，我可以在必要的时候介入掌控Agent的执行，我可以异步处理这些任务，无需盯着电脑看它执行。

随后，我在4月份新建了GoHumanLoop这个项目的文件夹

二. 事情经过

在开始写代码前，我对GoHumanLoop进行了产品定位和架构设计

GoHumanLoop的定位: 我认为它是一个AI的基础设施，是长在各大Agent框架（LangGraph、CrewAI）中的一个中间层，它充当了这些 AI 框架和人交互的协同桥梁
架构设计

GoHumanLoop SDK 负责快速实现在各大Agent框架的Human-in-the-loop介入，需要方便快捷易用。这里介入需要有审批功能和外部信息获取这两种能力

经过我分析目前这些 Agent 框架在人机协同工作一般都是交由前端来实现，而GoHumanLoop就是可以快速帮助开发者能便捷的实现这种人机协同交互

GoHumanLoopHub是作为一个SaaS化的管理平台，负责管理接收SDK的人机交互请求，按需转发给各个OA系统或者个人邮件等。（这种模式类似于AgentOps）

想到这突然发现GoHumanLoop要做好，内容就非常多，又要做工具，又要做平台，又要对接各个OA系统、个人微信、邮件等等，这整一个就是一个人机协同的生态体系，而这只是针对基础性的审批、信息获取这种操作，如果要涉及个人信息、支付申请这些内容更加庞大

不过既然已经决定要做，那就边干边想边解决

开源

我自认为我蛮有极客精神的，GoHumanLoop一开始我就定义要做开源，并且MIT>协议-真开源，能开尽开。如果有人能在我基础上打造得更好，那也是我的荣幸～真·用爱发电🤣

为了践行开源，在做GoHumanLoop SDK时，对连接GoHumanLoopHub并不强求，完全可以直接对接到对应的第三方系统或者自定义的方式，保持自由灵活度

经过几个月业余时间的努力，我已经算是初步实现了GoHumanLoop的目标，形成了一个小的生态系统

GoHumanLoop SDK适配各大AI Agent框架形成简单易用的使用方式，支持三种方式审批请求、信息获取和对话交流，去进行人机协同的处理
GoHumanLoop内部提供 HumanLoop 任务管理器和请求处理提供者(Provider),通过 API 方式与 GoHumanLoopHub 进行交互
GoHumanLoopHub还能与飞书、企业微信等进行集成，实现与飞书、企业微信等应用的无缝对接。需要依赖一层转换层，目前已提供对应的服务程序例子gohumanloop-feishu和gohumanloop-wework 后续还会继续拓展其它 OA 平台，让人机协同更好的集成到业务当中
管理人员通过GoHumanLoopHub提供的 API 接口，Agent 进行交互，提供用户信息、反馈、审批等信息
GoHumanLoopHub还提供了任务数据管理功能，Agent 可以将任务数据同步到GoHumanLoopHub中，方便后续分析和管理

上述架构涉及到的工具和平台，我均进行了开源:
GoHumanLoop 增强Agent人机协同能力｜Perfecting AI workflows with human intelligence
gohumanloophub GoHumanLoopHub人机协同管理平台
gohumanloop-feishu GoHumanLoop飞书服务示例仓库
gohumanloop-weixin GoHumanLoop企业微信服务示例仓库
gohumanloop-examples 针对以上工具的使用示例集合

三. 自我反思

一路折腾下来，其实我对GoHumanLoop也有不少反思：

节奏问题

从最初想法到现在能跑通基本 Demo，其实耗时比我预期的要长。一个很大的原因是我在产品和技术上都想做到「面面俱到」，容易分散精力。未来需要学会抓重点，把最核心的价值点先打磨好，再逐步扩展。
边界问题

人机协同本身是个特别大的话题，从 Agent 框架 SDK，到 Hub 平台，再到 OA 系统对接，每一个点都能延伸出一个完整的产品。如何划清GoHumanLoop的边界，聚焦在「最核心、最通用」的能力，而不是无止境地扩展，值得持续思考。
价值验证问题

技术上我可以不断迭代，但产品价值最终还是要看能否被实际使用和认可。目前更多还停留在个人探索和开源尝试阶段，下一步应该把更多精力放在和潜在用户、开发者的沟通，去验证它在真实业务中的价值。
个人精力与长期坚持

目前大部分开发时间都是业余完成，难免出现进展缓慢的情况。但长期做一个项目更需要耐心和持续投入，我得提醒自己少一些急躁，多一些耐力。

四. 未来的一些期待

回顾这几个月，GoHumanLoop已经从一个灵感逐渐发展成一个产品雏形。但这仅仅是开始，未来我对它的设想还有很多：

更丰富的 SDK 适配

目前已经适配了 LangGraph、CrewAI 等框架，但未来会继续扩展到更多 AI Agent 框架（如 Autogen、Haystack、LlamaIndex），并提供更加简洁直观的 API，让开发者可以「一行接入，立刻拥有 HITL（Human-in-the-loop）能力」。
更通用的协同模型

审批、信息获取、对话交流只是第一步。未来将会探索更高级的人机协同模式，比如：
- 多人协同（团队与 Agent 共同决策）
- 异步协同（跨硬件、跨终端协同处理）
- 多信息协同（个人身份认证、关键密钥介入）
更强大的 Hub 能力

GoHumanLoopHub 未来可以增加：
- 工作流引擎：让人机协同可以编排复杂流程，而不只是单点审批
- 数据分析：沉淀和可视化人机协同过程中的数据，帮助企业优化决策
- 插件化集成：提供插件市场，方便快速接入 Slack、钉钉、飞书、Notion 等常见平台
社区与生态建设 我希望 GoHumanLoop 不只是我一个人的项目，而是一个开源社区共建的生态：
- 建立使用者和贡献者社区
- 提供更多 examples 与教程，降低使用门槛
- 举办线上分享、Workshop，吸引更多开发者参与
探索商业化可能 在坚持开源的前提下，也会探索一些商业化模式：
- 面向企业的 SaaS 版本（安全、合规、可扩展）
- 专业的插件/集成服务（如对接企业内部系统）
- 高级数据分析与团队协作功能

总结一下，我希望未来的 GoHumanLoop 能真正成为 AI Agent 时代的人机协同基础设施，帮助更多开发者和企业把 AI 从「好玩」变成「好用」。

希望通过这个项目认识更多小伙伴，一起交流探讨学习～ 🎉