OWL 简明指南:快速上手

🦉 OWL 是一个前沿的多智能体协作框架,推动任务自动化的边界,构建在 Camel AI 之上,其愿景是彻底变革 AI 智能体协作解决现实任务的方式。通过利用动态智能体交互,OWL 实现了跨多领域更自然、高效且稳健的任务自动化。 github.com/camel-ai/ow...

前言

日前,在 Manus 引爆社交媒体后,多个开源通用 Agent 也迅速出圈,OWL 便是其中之一。然而,笔者在遵循 Github 官方指南安装运行 OWL 时,也遇到一些问题。本文旨在提供一个更简单的部署指南,让您快速体验这个 Agent 的魅力。

安装

1)准备好 git 和 python

从各自官网安装即可,Python 3.10, 3.11, 3.12 取其一,无需多言

2)安装 uv

arduino 复制代码
# uv 是这个项目需要用到的 python 包管理器(之一),用来管理项目依赖。
pip install uv

3)克隆 GitHub 仓库

bash 复制代码
git clone https://github.com/camel-ai/owl.git

4)进入项目目录

bash 复制代码
cd owl

5)激活虚拟环境

bash 复制代码
# 对于 macOS/Linux
source .venv/bin/activate
# 对于 Windows
.venv\Scripts\activate

6)开启科学上网(非必须,会更快更稳定),安装 CAMEL 及其所有依赖

bash 复制代码
# 依赖下载完成后会有较长的一段 preparing packages 的时间,请耐心等候
uv pip install -e .

注意‼️ 完成以上步骤后即可暂停,不要执行官方指南里的 deactivate 命令,否则离开虚拟环境后会因依赖缺失,无法运行项目

设置 API Key

OWL 调用模型完成各种任务,因此我们需要一个 api key 提供这个基础能力。以下是 OWL 目前支持的模型提供商

  • OpenAI
  • Qwen
  • DeepSeek
  • Groq
  • Azure

1)获取 API key

如果你之前没有使用过 api key,这里求快的话建议直接使用 Qwen,因为目前阿里有注册送 100w token 的活动,遵循指南(help.aliyun.com/zh/model-st... 完成注册和 api key 的获取。

如果你已有以上可用的模型提供商的 key,请按照喜好配置。

2)配置 .env

OWL 会读取 owl/owl/.env 这个文件里配置的 api key 进行模型调用,这个文件一开始是没有的,我们需要从模板复制一个出来:

bash 复制代码
# 注意,执行完你应该在 owl/owl 目录下,这里有两层 owl 文件夹 !!
cd owl
# 从模板复制一个 .env 出来
cp .env_template .env   

接着用你喜欢的编辑器打开 .env 文件,把刚才申请到的 Qwn api key 或已有的 key 填到对应的地方

ini 复制代码
...
# Qwen API (https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key)
QWEN_API_KEY='你申请到的 key'
# QWEN_API_BASE_URL=""
...

注意:如果是其他模型提供商的 key,需要填到对应的位置。最后,除了我们需要的(例如这里是 Qwen),其他模型提供商的配置都应该是被注释的。

运行 OWL

运行入口位于 owl/owl,确保你在这个目录下

bash 复制代码
# 中文版本
python webapp_zh.py
# 英文版本
python webapp.py

运行成功后,你应该看到如下提示

打开 local URL 后面的网址,即可看到 OWL GUI 使用界面。 注意:后面当你第一次执行任务时,会有安装浏览器相关组件的动作,需要等待一段时间 可以看到目前整个产品形态还是处于比较初级的阶段。这里可以点击 Examples 下的默认示例来测试功能,例如这里我测试了第一个示例的最终效果如下: 从对话记录来看,OWL 的工作流程中 User Agent 和 Assistant Agent 两个角色交替出现,前者负责规划,后者负责执行,是当前通用 Agent 的典型设计。

在这个示例里,OWL 做了如下事情:

  1. 调用百度搜索获取到 Camel 的 github 地址
  2. 调用浏览器进入 Camel 的 github 主页,获取到它的 star 和 folk 数据
  3. 编写 python 代码,图形化展示 Camel 的 github 数据

可以看到 OWL 已经展示了初步的任务规划和工具调用能力,关于更复杂更真实的场景后续测试后再与大家分享。

bash 复制代码
# 结束使用后,记得调用 deactivate 命令退出虚拟环境
deactivate

结尾

这篇文章主要想让不熟悉技术或者 python 项目的朋友快速地将 OWL 跑起来,体验开源 Agent 的魅力。总结有以下注意事项:

  • Python 版本需要在 3.10~3.12 之间
  • 使用 uv 作为包管理器(后续也方便我们配置 mcp 服务)
  • 项目依赖较多,最好在安装前科学上网;依赖下载完成后有较长的 preparing packages 的时间,请耐心等待
  • 在进入虚拟化环境、安装所有项目依赖后,在将 OWL GUI 跑起来前,不要执行 deactivate
  • 对模型 API 调用不是很熟悉的朋友,可以使用 Qwen 的 API Key 作为测试(注册简便,送 100w token)
  • 第一次执行任务时,会有安装浏览器相关组件的动作,需要等待一段时间
  • 执行 OWL 内置的示例时,结束前,不要频繁切换窗口,否则会影响任务的规划调度。
相关推荐
Panesle19 分钟前
transformer架构与其它架构对比
人工智能·深度学习·transformer
我有医保我先冲44 分钟前
AI大模型与人工智能的深度融合:重构医药行业数字化转型的底层逻辑
人工智能·重构
pen-ai1 小时前
【NLP】15. NLP推理方法详解 --- 动态规划:序列标注,语法解析,共同指代
人工智能·自然语言处理·动态规划
Chaos_Wang_1 小时前
NLP高频面试题(二十九)——大模型解码常见参数解析
人工智能·自然语言处理
EdisonZhou1 小时前
使用MCP C# SDK开发MCP Server + Client
llm·aigc·asp.net core·.net core
Acrelhuang1 小时前
8.3MW屋顶光伏+光储协同:上海汽车变速器低碳工厂的能源革命-安科瑞黄安南
大数据·数据库·人工智能·物联网·数据库开发
区块链蓝海1 小时前
沉浸式体验测评|AI Ville:我在Web3小镇“生活”了一周
人工智能·web3·生活
whaosoft-1432 小时前
51c自动驾驶~合集15
人工智能
花楸树2 小时前
前端搭建 MCP Client(Web版)+ Server + Agent 实践
前端·人工智能