OWL 简明指南:快速上手

🦉 OWL 是一个前沿的多智能体协作框架,推动任务自动化的边界,构建在 Camel AI 之上,其愿景是彻底变革 AI 智能体协作解决现实任务的方式。通过利用动态智能体交互,OWL 实现了跨多领域更自然、高效且稳健的任务自动化。 github.com/camel-ai/ow...

前言

日前,在 Manus 引爆社交媒体后,多个开源通用 Agent 也迅速出圈,OWL 便是其中之一。然而,笔者在遵循 Github 官方指南安装运行 OWL 时,也遇到一些问题。本文旨在提供一个更简单的部署指南,让您快速体验这个 Agent 的魅力。

安装

1)准备好 git 和 python

从各自官网安装即可,Python 3.10, 3.11, 3.12 取其一,无需多言

2)安装 uv

arduino 复制代码
# uv 是这个项目需要用到的 python 包管理器(之一),用来管理项目依赖。
pip install uv

3)克隆 GitHub 仓库

bash 复制代码
git clone https://github.com/camel-ai/owl.git

4)进入项目目录

bash 复制代码
cd owl

5)激活虚拟环境

bash 复制代码
# 对于 macOS/Linux
source .venv/bin/activate
# 对于 Windows
.venv\Scripts\activate

6)开启科学上网(非必须,会更快更稳定),安装 CAMEL 及其所有依赖

bash 复制代码
# 依赖下载完成后会有较长的一段 preparing packages 的时间,请耐心等候
uv pip install -e .

注意‼️ 完成以上步骤后即可暂停,不要执行官方指南里的 deactivate 命令,否则离开虚拟环境后会因依赖缺失,无法运行项目

设置 API Key

OWL 调用模型完成各种任务,因此我们需要一个 api key 提供这个基础能力。以下是 OWL 目前支持的模型提供商

  • OpenAI
  • Qwen
  • DeepSeek
  • Groq
  • Azure

1)获取 API key

如果你之前没有使用过 api key,这里求快的话建议直接使用 Qwen,因为目前阿里有注册送 100w token 的活动,遵循指南(help.aliyun.com/zh/model-st... 完成注册和 api key 的获取。

如果你已有以上可用的模型提供商的 key,请按照喜好配置。

2)配置 .env

OWL 会读取 owl/owl/.env 这个文件里配置的 api key 进行模型调用,这个文件一开始是没有的,我们需要从模板复制一个出来:

bash 复制代码
# 注意,执行完你应该在 owl/owl 目录下,这里有两层 owl 文件夹 !!
cd owl
# 从模板复制一个 .env 出来
cp .env_template .env   

接着用你喜欢的编辑器打开 .env 文件,把刚才申请到的 Qwn api key 或已有的 key 填到对应的地方

ini 复制代码
...
# Qwen API (https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key)
QWEN_API_KEY='你申请到的 key'
# QWEN_API_BASE_URL=""
...

注意:如果是其他模型提供商的 key,需要填到对应的位置。最后,除了我们需要的(例如这里是 Qwen),其他模型提供商的配置都应该是被注释的。

运行 OWL

运行入口位于 owl/owl,确保你在这个目录下

bash 复制代码
# 中文版本
python webapp_zh.py
# 英文版本
python webapp.py

运行成功后,你应该看到如下提示

打开 local URL 后面的网址,即可看到 OWL GUI 使用界面。 注意:后面当你第一次执行任务时,会有安装浏览器相关组件的动作,需要等待一段时间 可以看到目前整个产品形态还是处于比较初级的阶段。这里可以点击 Examples 下的默认示例来测试功能,例如这里我测试了第一个示例的最终效果如下: 从对话记录来看,OWL 的工作流程中 User Agent 和 Assistant Agent 两个角色交替出现,前者负责规划,后者负责执行,是当前通用 Agent 的典型设计。

在这个示例里,OWL 做了如下事情:

  1. 调用百度搜索获取到 Camel 的 github 地址
  2. 调用浏览器进入 Camel 的 github 主页,获取到它的 star 和 folk 数据
  3. 编写 python 代码,图形化展示 Camel 的 github 数据

可以看到 OWL 已经展示了初步的任务规划和工具调用能力,关于更复杂更真实的场景后续测试后再与大家分享。

bash 复制代码
# 结束使用后,记得调用 deactivate 命令退出虚拟环境
deactivate

结尾

这篇文章主要想让不熟悉技术或者 python 项目的朋友快速地将 OWL 跑起来,体验开源 Agent 的魅力。总结有以下注意事项:

  • Python 版本需要在 3.10~3.12 之间
  • 使用 uv 作为包管理器(后续也方便我们配置 mcp 服务)
  • 项目依赖较多,最好在安装前科学上网;依赖下载完成后有较长的 preparing packages 的时间,请耐心等待
  • 在进入虚拟化环境、安装所有项目依赖后,在将 OWL GUI 跑起来前,不要执行 deactivate
  • 对模型 API 调用不是很熟悉的朋友,可以使用 Qwen 的 API Key 作为测试(注册简便,送 100w token)
  • 第一次执行任务时,会有安装浏览器相关组件的动作,需要等待一段时间
  • 执行 OWL 内置的示例时,结束前,不要频繁切换窗口,否则会影响任务的规划调度。
相关推荐
piggy侠17 小时前
百度PaddleOCR-VL:基于0.9B超紧凑视觉语言模型,支持109种语言,性能超越GPT-4o等大模型
人工智能·算法·机器学习
xiaoxiaoxiaolll17 小时前
封面论文丨薄膜铌酸锂平台实现强耦合电光调制,《Light Sci. Appl. 》报道机器学习优化新范式
人工智能·学习
XiaoYu200217 小时前
AI精准提问手册:从模糊需求到精准输出的核心技能(上)
前端·人工智能·程序员
java_logo17 小时前
Docker 部署 MinerU 教程:打造你的本地 PDF 智能处理中心
linux·运维·人工智能·docker·ai·容器·aigc
做运维的阿瑞17 小时前
鸿蒙6.0技术解析:五大行业迎来的智能化革命
人工智能·harmonyos
双向3317 小时前
技术引领场景革新|合合信息PRCV论坛聚焦多模态文本智能前沿实践
人工智能
孤狼灬笑17 小时前
自然语言处理(NLP)—发展历程(背景、技术、优缺点、未来方向)
人工智能·自然语言处理·nlp
特拉熊17 小时前
Windows上使用Docker Desktop部署GPUStack
人工智能·程序员
LLM大模型17 小时前
DeepSeek V3.2 AI辅助-构建可视化多维知识立方体展示知识体系
人工智能