AutoGPT等自动代理

前言

LangChain 开发智能Agent - 掘金 (juejin.cn)一文中,我们介绍了CAMEL框架。LangChain将基于CAMEL的代理定义为Simulation Agents(模拟代理)。它主要通过角色扮演,多轮对话聊天的方式完成具体任务。

本文我们将讨论一种新型的代理,Autonomous Agents(自主代理),它被设计为能够独立完成任务,AutoGPT、BabyAGI 和 HuggingGPT等是这一派的代表,我们来看下。

AutoGPT

AutoGPT是一个开源的自主AI代理,主要功能是自动链接多个任务,来完成任务。它和ChatGPT不同的地方是,用户只需提供一个Prompt,AutoGPT会自动化多步Prompt过程,将目标分解为子任务,以完成任务。AutoGPT 基于GPT-4。

AutoGPT有哪些优点呢?

  • 与互联网集成

ChatGPT训练的数据是截至某一时刻的数据,所以,当我们在问chatgpt一些时效性问题时,ChatGPT可能就不知道或说瞎话...AutoGPT与互联网集成,提供实时数据访问。

  • 任务分解

AutoGPT将任务分解为多个子任务,并会自我提示,以达到目的。不需要像ChatGPT那样需要用户多次提示,更智能,更好地展示了AI的自主行动力。

  • 支持多模态

除了文本,还可以将图像作为输入。

ChatGPT适合的场景有文本生成、执行特定操作(callback fucntions)、网络搜索,还可帮助进行科学研究、市场研究、内容创建、销售线索生成、业务计划创建、产品评论等。当然,它也有一些缺点,比如成本比较高,因为它基于GPT-4,而且它没有长期记忆。

我们来看个例子,假设我们想要AutoGPT帮我们写一篇关于太空的文章。它的运行步骤大概是这样的:

  • AutoGPT 会在Pinecone里查看有没有已经写好的关于太空的文章。 Pinecone是一个向量数据库,如果有,会将文章直接展示给我们。如果没有,它就会进行下一步
  • AutoGPT会用GPT-4来生成一个Prompt   比如说这个太空是什么, GPT-4回答这个问题,并将结果存储到Pinecone里。
  • AutoGPT 会继续问一些问题,直到PineCone里存储了足够多的内容,然后组合成一篇文章,返回给用户。

Baby AGI

Baby AGI是一套自主任务驱动AI系统,可以根据目标生成、组织、确定优先级以及执行任务。它也使用GPT-4来理解和创建任务,利用Pinecone向量搜索来存储和检索。被誉为完全自主人工智能的起点

它有以下几个特点:

  • 任务列表

当Baby AGI接收到用户提出的任务后,它将任务分成列表,并排一个优先级。将优先级最高的第一个任务,使用GPT-4发送到Agent执行,并将结果存储在内存中。然后根据目标和上一个任务的结果创建新任务并确定其优先级。

HuggingGPT

HuggingGPT分四个阶段来实现Autonomous Agents。

  • 任务规划

LLM根据用户请求,生成任务列表,并确定任务之间的执行顺序资源依赖关系

  • 模型选择

LLM根据Hugging Face上的描述,为任务分配合适的模型。

  • 任务执行

被选中的模型,执行分配的任务

  • 响应生成

向用户提供响应。

Hugging Face的优势在于,它能够使用不同的模型来执行特定的任务,比如, 它可以使用OpenCV的OpenRose模型来分析图像中小朋友的姿势,并使用其它模型生成新图像和描述。

总结

  • 自主代理也有几种框架,我们这里介绍了AutoGPT、Baby AGI和HuggingGPT
相关推荐
jndingxin21 分钟前
OpenCV 图像哈希类cv::img_hash::AverageHash
人工智能·opencv·哈希算法
堆栈future29 分钟前
深度剖析Manus:如何打造低幻觉、高效率、安全可靠的Agentic AI系统
llm·aigc·mcp
Jamence34 分钟前
多模态大语言模型arxiv论文略读(153)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
晨曦54321042 分钟前
量子计算突破:8比特扩散模型实现指数级加速
人工智能
Albert_Lsk1 小时前
【2025/07/11】GitHub 今日热门项目
人工智能·开源·github·开源协议
莫彩1 小时前
【大模型推理论文阅读】Enhancing Latent Computation in Transformerswith Latent Tokens
论文阅读·人工智能·语言模型
康斯坦丁师傅1 小时前
全球最强模型Grok4,国内已可免费使用!(附教程)
人工智能·grok
崔高杰1 小时前
微调性能赶不上提示工程怎么办?Can Gradient Descent Simulate Prompting?——论文阅读笔记
论文阅读·人工智能·笔记·语言模型
元气小嘉1 小时前
前端技术小结
开发语言·前端·javascript·vue.js·人工智能
AI大模型1 小时前
大模型炼丹术(七):LLM微调实战:训练一个垃圾邮件分类器
程序员·llm·agent