LLM之Agent(一):使用GPT-4开启AutoGPT Agent自动化任务完整指南

在ChatGPT引领的大模型时代,要想让大模型按照用户的指令执行,Prompt设计是一门艺术,由此还催生了一个职业"Prompt工程师"。其实,并不是所有人都可以设计出好的Prompt,甚至同样的Prompt应用在不同的大模型上表现的结果也是不一样的。虽然ChatGPT或者GPT-4可以调用一些插件来完成更多的功能,但总体来说功能有限。大模型后时代是什么?会是Agent吗?

Agent可以根据用户任务描述可以拆分任务、规划任务、执行任务,本文将分享Agent代表作之一AutoGPT。

一、AutoGPT介绍

2023年3月30日,AutoGPT是一个实验性开源项目,可以定义一个特定的角色(比如,"图书市场分析师")和一系列目标(例如,"研究2022年最成功的科幻小说"、"总结它们"、"将摘要保存到文件中"等),并让GPT-4自动创建和执行实现目标所需的所有必要任务,具体包括:

  • 通过搜索引擎进行研究;
  • 浏览网站;
  • 爬取数据;
  • 本地存储文件;
  • 使用长期记忆;
  • 生成具有特殊角色的GPT-3.5机器人程序的新实例以完成子任务

(不用担心,如果您无法访问GPT-4,您也可以使用GPT-3.5 API密钥运行它)

二、AutoGPT使用

2.1 开发环境

2.2 克隆AutoGPT代码

复制代码
git clone https://github.com/Torantulino/Auto-GPT.git# 切换到 stable分支git checkout stable

PS:直接下载ZIP文件也可以

2.3 安装开发所需要的python库

复制代码
# 切换到Auto-GPT根目录,执行如下代码pip install -r requirements.txt

2.4 添加GPT4 API keys

复制.env.template为.env文件,把GPT-4 API keys填写到.env文件中字段OPENAI_API_KEY

.env.template文件格式如下所示:

2.5 启动AutoGPT​​​​​​​

复制代码
python -m autogpt# 如果不想使用GPT-4,可以使用如下代码启动AutoGPTpython -m autogpt --gpt3only

此时,界面会让用户选择是否想继续使用你创建的最后一个人工智能代理。如果你想尝试一下,请键入"y",或者键入"n"创建一个新的。

如果确定创建一个新的Agent,那么需要定义一个名字以及角色的描述:

接下来,定义最多5个目标(Goal)

至此,Auto-GPT开始如期执行,但是需要用户授权接下来的操作,用户可以输入y表示授权下一步操作,输入y-N表示用户可以授权接下来几个步骤的操作,输入n表示退出;当然如果输入其他内容,Auto-GPT会当做是人类的反馈,Auto-GPT会进行评估:

2.6 检查生成的结果

Auto-GPT生成的结果可以在文件夹"/outputs/logs"或者"/auto_gpt_workspace"查看

三、AutoGPT&向量数据库

对于LLM应用开发来说,向量数据库似乎是比不可少的存在,就连早期的AutoGPT也默认支持以下五种存储模式:

  • LocalCache (will be renamed to JSONFileMemory)

  • Redis

  • Milvus

  • Pinecone

  • Weaviate

但是最近AutoGPT说明文档显示将删除所有向量数据库实现,如下图所示:

更多内容可以参考:https://mp.weixin.qq.com/s/mlUg1N7jQ5f6HVKKOvKOjA

向量数据库是否真是必要的呢?

参考文献:

1\] https://generativeai.pub/complete-guide-to-setup-autogpt-revolutionize-your-task-automation-with-gpt-4-39eda5a85821 \[2\] https://github.com/Torantulino/Auto-GPT

相关推荐
思通数据23 分钟前
AI全域智能监控系统重构商业清洁管理范式——从被动响应到主动预防的监控效能革命
大数据·人工智能·目标检测·机器学习·计算机视觉·数据挖掘·ocr
flex888826 分钟前
FramePack - 开源 AI 视频生成工具
人工智能·开源·音视频
jndingxin1 小时前
OpenCV CUDA模块中矩阵操作------范数(Norm)相关函数
人工智能·opencv
何双新1 小时前
第6讲、全面拆解Encoder、Decoder内部模块
人工智能
jzwei0231 小时前
Transformer Decoder-Only 算力FLOPs估计
人工智能·深度学习·transformer
lilye661 小时前
精益数据分析(55/126):双边市场模式的挑战、策略与创业阶段关联
大数据·人工智能·数据分析
weixin_408266342 小时前
深度学习-分布式训练机制
人工智能·分布式·深度学习
struggle20252 小时前
AgenticSeek开源的完全本地的 Manus AI。无需 API,享受一个自主代理,它可以思考、浏览 Web 和编码,只需支付电费。
人工智能·开源·自动化
Panesle2 小时前
阿里开源通义万相Wan2.1-VACE-14B:用于视频创建和编辑的一体化模型
人工智能·开源·大模型·文生视频·多模态·生成模型
北漂老男孩2 小时前
ChromeDriver 技术生态与应用场景深度解析
java·爬虫·python·自动化