想在AI 时代做点东西,GoHumanLoop阶段性总结

前言

上周我花了两天周末时间把GoHumanLoop官网做好,发布上线了 🎉🎉🎉

不知不觉已经做GoHumanLoop一段时间,是时候该做一个阶段性的总结了,趁着这个机会回答一下很多人问我的问题:

  • GoHumanLoop到底是什么?它在解决什么问题?

一. 事情起因

自从22年底GPT3.5出来后,一直都在跟着AI时代的潮流向前摸索,相信很多人也和我有一样想法,趁着这一轮AI浪潮早期,尽早下场看能赶得上车吗,毕竟人家说站在风口上猪都能飞起来。

所以我就开始了我的折腾,从做一些AI开源的项目,到做一款智能阅读产品「帝阅DeepRead」,一路不断总结和积累对这轮AI技术变革的理解,提高自己产品的认知能力。

今年三、四月份,在看到Manus在通用Agent领域的能力展示时,我突然有个思考💡,

  • 随着Agent能力越来越强,场景复杂复杂度的提升,长程的任务必然会出现
  • 云端AI Agent--无GUI的Agent,异步处理场景也将会出现

基于这种新技术下的人机交互该是如何一个形式呢?当AI作为我们智能伙伴在帮助我处理任务时,我和它是一个怎样的协同方式,来确保它的执行任务和我们想法对齐,确保可靠的执行和交付价值?

所以我想到我去做一个产品,去解决在AI Agent时代下的人机协同问题,这个产品至少要解决长程任务下,我可以在必要的时候介入掌控Agent的执行,我可以异步处理这些任务,无需盯着电脑看它执行。

随后,我在4月份新建了GoHumanLoop这个项目的文件夹

二. 事情经过

在开始写代码前,我对GoHumanLoop进行了产品定位和架构设计

  • GoHumanLoop的定位: 我认为它是一个AI的基础设施,是长在各大Agent框架(LangGraph、CrewAI)中的一个中间层,它充当了这些 AI 框架和人交互的协同桥梁

  • 架构设计

GoHumanLoop SDK 负责快速实现在各大Agent框架的Human-in-the-loop介入,需要方便快捷易用。这里介入需要有审批功能外部信息获取这两种能力

经过我分析目前这些 Agent 框架在人机协同工作一般都是交由前端来实现,而GoHumanLoop就是可以快速帮助开发者能便捷的实现这种人机协同交互

GoHumanLoopHub是作为一个SaaS化的管理平台,负责管理接收SDK的人机交互请求,按需转发给各个OA系统或者个人邮件等。(这种模式类似于AgentOps)

想到这突然发现GoHumanLoop要做好,内容就非常多,又要做工具,又要做平台,又要对接各个OA系统、个人微信、邮件等等,这整一个就是一个人机协同的生态体系,而这只是针对基础性的审批、信息获取这种操作,如果要涉及个人信息、支付申请这些内容更加庞大

不过既然已经决定要做,那就边干边想边解决

开源

我自认为我蛮有极客精神的,GoHumanLoop一开始我就定义要做开源,并且MIT>协议-真开源,能开尽开。 如果有人能在我基础上打造得更好,那也是我的荣幸~ 真·用爱发电🤣

为了践行开源,在做GoHumanLoop SDK时,对连接GoHumanLoopHub并不强求,完全可以直接对接到对应的第三方系统或者自定义的方式,保持自由灵活度

经过几个月业余时间的努力,我已经算是初步实现了GoHumanLoop的目标,形成了一个小的生态系统

  1. GoHumanLoop SDK适配各大AI Agent框架形成简单易用的使用方式,支持三种方式审批请求信息获取对话交流,去进行人机协同的处理
  2. GoHumanLoop内部提供 HumanLoop 任务管理器和请求处理提供者(Provider),通过 API 方式与 GoHumanLoopHub 进行交互
  3. GoHumanLoopHub还能与飞书、企业微信等进行集成,实现与飞书、企业微信等应用的无缝对接。需要依赖一层转换层,目前已提供对应的服务程序例子gohumanloop-feishugohumanloop-wework 后续还会继续拓展其它 OA 平台,让人机协同更好的集成到业务当中
  4. 管理人员通过GoHumanLoopHub提供的 API 接口,Agent 进行交互,提供用户信息、反馈、审批等信息
  5. GoHumanLoopHub还提供了任务数据管理功能,Agent 可以将任务数据同步到GoHumanLoopHub中,方便后续分析和管理

上述架构涉及到的工具和平台,我均进行了开源:
GoHumanLoop 增强Agent人机协同能力 |Perfecting AI workflows with human intelligence
gohumanloophub GoHumanLoopHub人机协同管理平台
gohumanloop-feishu GoHumanLoop飞书服务示例仓库
gohumanloop-weixin GoHumanLoop企业微信服务示例仓库
gohumanloop-examples 针对以上工具的使用示例集合

三. 自我反思

一路折腾下来,其实我对GoHumanLoop也有不少反思:

  1. 节奏问题

    从最初想法到现在能跑通基本 Demo,其实耗时比我预期的要长。一个很大的原因是我在产品和技术上都想做到「面面俱到」,容易分散精力。未来需要学会抓重点,把最核心的价值点先打磨好,再逐步扩展。

  2. 边界问题

    人机协同本身是个特别大的话题,从 Agent 框架 SDK,到 Hub 平台,再到 OA 系统对接,每一个点都能延伸出一个完整的产品。如何划清GoHumanLoop的边界,聚焦在「最核心、最通用」的能力,而不是无止境地扩展,值得持续思考。

  3. 价值验证问题

    技术上我可以不断迭代,但产品价值最终还是要看能否被实际使用和认可。目前更多还停留在个人探索和开源尝试阶段,下一步应该把更多精力放在和潜在用户、开发者的沟通,去验证它在真实业务中的价值。

  4. 个人精力与长期坚持

    目前大部分开发时间都是业余完成,难免出现进展缓慢的情况。但长期做一个项目更需要耐心和持续投入,我得提醒自己少一些急躁,多一些耐力。


四. 未来的一些期待

回顾这几个月,GoHumanLoop已经从一个灵感逐渐发展成一个产品雏形。但这仅仅是开始,未来我对它的设想还有很多:

  1. 更丰富的 SDK 适配

    目前已经适配了 LangGraph、CrewAI 等框架,但未来会继续扩展到更多 AI Agent 框架(如 Autogen、Haystack、LlamaIndex),并提供更加简洁直观的 API,让开发者可以「一行接入,立刻拥有 HITL(Human-in-the-loop)能力」。

  2. 更通用的协同模型

    审批、信息获取、对话交流只是第一步。未来将会探索更高级的人机协同模式,比如:

    • 多人协同(团队与 Agent 共同决策)
    • 异步协同(跨硬件、跨终端协同处理)
    • 多信息协同(个人身份认证、关键密钥介入)
  3. 更强大的 Hub 能力

    GoHumanLoopHub 未来可以增加:

    • 工作流引擎:让人机协同可以编排复杂流程,而不只是单点审批
    • 数据分析:沉淀和可视化人机协同过程中的数据,帮助企业优化决策
    • 插件化集成:提供插件市场,方便快速接入 Slack、钉钉、飞书、Notion 等常见平台
  4. 社区与生态建设 我希望 GoHumanLoop 不只是我一个人的项目,而是一个开源社区共建的生态:

    • 建立使用者和贡献者社区
    • 提供更多 examples 与教程,降低使用门槛
    • 举办线上分享、Workshop,吸引更多开发者参与
  5. 探索商业化可能 在坚持开源的前提下,也会探索一些商业化模式:

    • 面向企业的 SaaS 版本(安全、合规、可扩展)
    • 专业的插件/集成服务(如对接企业内部系统)
    • 高级数据分析与团队协作功能

总结一下,我希望未来的 GoHumanLoop 能真正成为 AI Agent 时代的人机协同基础设施,帮助更多开发者和企业把 AI 从「好玩」变成「好用」。

希望通过这个项目认识更多小伙伴,一起交流探讨学习~ 🎉

相关推荐
waterHBO5 小时前
使用 gemini 来分析 github 项目
github·agent·gemini
前网易架构师-高司机7 小时前
Coze Studio开源版:AI Agent开发平台的深度技术解析- 入门篇
agent·工作流·字节·eino·coze studio
大熊猫侯佩7 小时前
斯塔克工业技术日志:用基础模型打造 “战甲级” 结构化 AI 功能
ai编程·swift·apple
lecepin9 小时前
AI Coding 资讯 2025.8.27
前端·ai编程
阿里云云原生9 小时前
AI Agent 发展趋势与架构演进
agent
柿蒂10 小时前
从动态缩放自定义View,聊聊为什么不要把问题复杂化
android·ai编程·android jetpack
执键行天涯10 小时前
从双重检查锁定的设计意图、锁的作用、第一次检查提升性能的原理三个角度,详细拆解单例模式的逻辑
java·前端·github
不想取名5611 小时前
VSCode MCP体验
ai编程
AI大模型11 小时前
技术实践 | 几乎零代码!像搭乐高一样做AI应用,LazyLLM确实有点东西!
程序员·llm·agent