❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!
🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦
🎯 「开发者解放双手!港大开源框架让AI智能体开发变成填空题」
大家好,我是蚝油菜花。你是否也经历过这些开发噩梦------
- 👉 想做个智能助手却卡在API对接,文档看到瞳孔地震
- 👉 调试多智能体协作时,日志复杂得像摩斯密码
- 👉 明明有顶级LLM,却因工程化门槛只能跑Demo...
今天要介绍的 AutoAgent ,正在颠覆AI智能体开发方式!这个港大开源框架用三大黑科技:
- ✅ 自然语言编程:描述需求即可生成智能体,无需写一行代码
- ✅ 自进化架构:智能体能动态优化工具和工作流
- ✅ 多模型支持:无缝切换Claude/GPT/DeepSeek等主流LLM
已有团队用它1天搭建跨境电商客服系统,金融分析师靠它自动生成投研报告------你的AI生产力,是时候开启「自动驾驶」模式了!
🚀 快速阅读
AutoAgent是香港大学推出的零代码LLM智能体开发框架。
- 功能:支持用户模式、智能体编辑器和工作流编辑器三种交互方式
- 技术:采用Agentic System Utilities架构,内置自管理向量数据库
AutoAgent 是什么
AutoAgent 是基于自然语言交互的自动化LLM智能体框架,用户无需编程即可创建定制化AI助手。其核心设计理念是将智能体开发转化为对话过程,通过多代理协作系统自动完成工具创建、任务分解和流程优化。
框架采用模块化设计,包含Agent Profiling Agent、Tool Editor Agent等核心组件,支持函数调用与ReAct双模式交互。在GAIA基准测试中,使用Claude 3.5的AutoAgent取得了与OpenAI Deep Research相当的性能,成为当前最强的开源替代方案之一。
AutoAgent 的主要功能
- 用户模式:开箱即用的多智能体系统,支持文件上传与复杂任务处理
- 智能体编辑器:通过对话配置AI助手参数和任务逻辑
- 工作流编辑器:用自然语言描述自动生成多步骤业务流程
- 双交互模式:同时支持函数调用和ReAct推理策略
- 向量数据库:内置自管理知识库实现长期记忆与RAG增强
AutoAgent 的技术原理
- 自然语言驱动:Agent Profiling Agent将用户需求转化为结构化代理描述
- LLM行动引擎:采用Direct/Transformed双范式生成可执行动作
- 动态工具创建:Tool Editor Agent自动生成并集成第三方API工具
- 多代理协作:Orchestrator代理实现任务分解与分布式执行
- 自优化架构:支持智能体在工作过程中持续改进策略
如何运行 AutoAgent
下面将详细介绍如何运行 AutoAgent,包括安装、配置 API 密钥、以及通过 CLI 模式启动框架。
安装 AutoAgent
AutoAgent 安装
使用以下命令克隆 AutoAgent 仓库并安装依赖:
bash
git clone https://github.com/HKUDS/AutoAgent.git
cd AutoAgent
pip install -e .
Docker 安装
AutoAgent 使用 Docker 容器化代理交互环境。首先确保已安装Docker
。AutoAgent 会根据您的机器架构自动拉取预构建的镜像,无需手动操作。
配置 API 密钥
在 .env
文件中设置所需的 API 密钥。以下是一个示例配置:
bash
# 必须的 GitHub Token
GITHUB_AI_TOKEN=your_github_token
# 可选的 API 密钥
OPENAI_API_KEY=your_openai_api_key
DEEPSEEK_API_KEY=your_deepseek_api_key
ANTHROPIC_API_KEY=your_anthropic_api_key
GEMINI_API_KEY=your_gemini_api_key
HUGGINGFACE_API_KEY=your_huggingface_api_key
GROQ_API_KEY=your_groq_api_key
XAI_API_KEY=your_xai_api_key
注意:并非所有 API 密钥都是必需的,只需配置您需要的 LLM 提供商的密钥。
启动 CLI 模式
AutoAgent 提供了两种 CLI 模式:auto main
和 auto deep-research
。以下是启动方式的详细说明。
使用 auto main
启动完整功能
此命令支持 user mode
、agent editor
和 workflow editor
模式。运行以下命令以启动:
bash
auto main
使用 auto deep-research
启动轻量模式
此命令仅启动 user mode
,适合快速使用。运行以下命令:
bash
auto deep-research
配置选项
以下是 auto main
命令的常用配置选项:
-
--container_name
:Docker 容器名称(默认为deepresearch
)。 -
--port
:容器端口(默认为12346
)。 -
COMPLETION_MODEL
:指定使用的 LLM 模型,需遵循Litellm
的命名规则(默认为claude-3-5-sonnet-20241022
)。 -
DEBUG
:启用调试模式以查看详细日志(默认为False
)。 -
API_BASE_URL
:LLM 提供商的 API 基础 URL(默认为None
)。 -
FN_CALL
:启用函数调用(默认为None
)。 -
Litellm :github.com/BerriAI/lit...
使用不同 LLM 提供商启动
你可以选择使用 DeepSeek 作为 LLM 提供商启动 AutoAgent:
DeepSeek
- 在
.env
文件中设置DEEPSEEK_API_KEY
。
bash
DEEPSEEK_API_KEY=your_deepseek_api_key
- 运行以下命令以启动Auto-Deep-Research。
bash
COMPLETION_MODEL=deepseek/deepseek-chat auto main
以下是使用其他 LLM 提供商启动 AutoAgent 的示例:
Anthropic
bash
ANTHROPIC_API_KEY=your_anthropic_api_key
auto main
OpenAI
bash
OPENAI_API_KEY=your_openai_api_key
COMPLETION_MODEL=gpt-4o auto main
Mistral
bash
MISTRAL_API_KEY=your_mistral_api_key
COMPLETION_MODEL=mistral/mistral-large-2407 auto main
Gemini
bash
GEMINI_API_KEY=your_gemini_api_key
COMPLETION_MODEL=gemini/gemini-2.0-flash auto main
Huggingface
bash
HUGGINGFACE_API_KEY=your_huggingface_api_key
COMPLETION_MODEL=huggingface/meta-llama/Llama-3.3-70B-Instruct auto main
Groq
bash
GROQ_API_KEY=your_groq_api_key
COMPLETION_MODEL=groq/deepseek-r1-distill-llama-70b auto main
OpenAI-Compatible Endpoints(如 Grok)
bash
OPENAI_API_KEY=your_api_key_for_openai_compatible_endpoints
COMPLETION_MODEL=openai/grok-2-latest API_BASE_URL=https://api.x.ai/v1 auto main
OpenRouter(如 DeepSeek-R1)
bash
OPENROUTER_API_KEY=your_openrouter_api_key
COMPLETION_MODEL=openrouter/deepseek/deepseek-r1 auto main
使用 user mode
创建代理
user mode
是一个开箱即用的多代理系统,能够通过自然语言创建和管理代理工具、工作流等。以下是使用 user mode
的步骤:
- 输入您希望创建的代理类型。
- AutoAgent 自动生成代理配置文件。
- 根据提示创建所需的工具和任务。
- 最终生成的代理可以立即使用。
使用 agent editor
和 workflow editor
创建代理
agent editor
- 输入您希望创建的代理类型。
- AutoAgent 自动生成代理配置文件。
- 创建所需的工具并完成任务设置。
- 生成代理并进入下一步。
workflow editor
- 输入您希望创建的工作流描述。
- AutoAgent 自动生成工作流配置文件。
- 完成任务设置并生成工作流。
小贴士
导入浏览器 Cookie
通过导入浏览器 Cookie,可以让代理更好地访问特定网站。具体操作请参考cookies
文件夹。
- cookies 文件夹 :github.com/HKUDS/AutoA...
添加第三方工具平台 API 密钥
如果您需要从第三方工具平台(如 RapidAPI)创建工具,请订阅相关工具并运行以下命令添加 API 密钥:
bash
python process_tool_docs.py
资源
- GitHub 仓库 :github.com/HKUDS/AutoA...
- 项目主页 :autoagent-ai.github.io
❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!
🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦