
从"问AI"到"AI自己干活"------研究、分析、生成全自动
支持Sub-Agents并行、沙箱隔离、跨会话记忆
登上GitHub Trending全球第一
🔍 先看痛点:AI能做研究,但做不完
你想让AI帮你做一份深度的市场研究报告、技术调研、或者竞品分析。
你跟ChatGPT说:
"帮我研究一下量子计算的行业现状"
它会给你一份答案。看起来不错,但:
- 信息可能过时(训练数据截止日之前)
- 深度不够(只能给你概括,做不到几十页的报告)
- 不能出成果(只能给你文字,不能给你一份PPT、一个网站、一个数据看板)
- 一次只能做一个任务(不能同时探索10个方向再汇总)
核心矛盾:
AI能回答问题和写摘要,但做不了真正的研究工作------那种需要多轮搜索、交叉验证、多方向并行探索、最终产出一个"成果"的复杂任务。
✅ DeerFlow 的解法
DeerFlow(Deep Exploration and Efficient Research Flow)是字节跳动开源的一个"超级AI代理工具包"。
一句话:给AI一台"自己的电脑",让它自己拆任务、自己干活、自己出成果
bash
# 安装和启动
git clone 项目地址
cd deer-flow
make config
make dev
然后你访问 http://localhost:2026,跟它说:
"帮我做一份关于AI视频生成工具的市场分析报告,包含主要玩家、技术路线、定价对比和未来趋势"
DeerFlow会:
- 拆解任务:自动分成10多个子任务
- 并行执行:每个子任务由一个独立的"Sub-Agent"负责
- 各自探索:每个Sub-Agent有自己的搜索工具、分析能力
- 汇总整合:最后合并成一份完整报告
- 输出成果:可以是Markdown报告、幻灯片、甚至一个网页
你需要的不是答案,是完成一个任务。DeerFlow帮你完成它。
🔥 它解决了什么?
1. "一次一个答案" vs "多路并行研究"
| 传统ChatGPT式对话 | DeerFlow | |
|---|---|---|
| 任务拆分 | 你要自己分步问 | ✅ AI自动拆解 |
| 并行能力 | 一次只能做一件事 | ✅ 同时跑多个Sub-Agent |
| 深度 | 受限于单次对话 | ✅ 每个方向都能深入探索 |
| 成果 | 文字回答 | ✅ 报告、PPT、网页、数据看板 |
2. "问完就忘" vs "有记忆、有环境"
| 传统AI | DeerFlow | |
|---|---|---|
| 跨会话记忆 | ❌ 每次重新开始 | ✅ 长期记忆(偏好、知识、工作习惯) |
| 文件系统 | ❌ 没有自己的"电脑" | ✅ 每个任务有隔离的沙箱(有硬盘、能跑代码) |
| 执行能力 | 只能"说" | ✅ 能读文件、写文件、执行bash命令 |
| 成果沉淀 | 在对话框里 | ✅ 产出可下载的文件、可访问的网页 |
3. 单一Agent vs 多Sub-Agent协作
一个复杂任务,比如"调研全球AI视频生成工具":
| 单Agent | DeerFlow多Sub-Agent | |
|---|---|---|
| 并行度 | 0(只能串行) | ✅ 10个同时跑 |
| 成本 | 总耗时=所有任务耗时之和 | ✅ 总耗时≈最长那个子任务 |
| 深度 | 浅(受限于上下文) | ✅ 每个方向都有独立上下文 |
| 抗干扰 | 容易被中间信息带偏 | ✅ 每个Agent只关注自己的任务 |
📦 核心能力
1. Skills与Tools ------ 让AI"什么都能做"
Skills是DeerFlow能做"几乎任何事情"的关键。每个Skill是一个结构化Markdown文件,里面定义了:
- 这个任务怎么做
- 需要什么工具
- 有什么注意事项
- 输出什么格式
内置Skills:
- 研究(Research)
- 报告生成(Report Generation)
- 幻灯片创建(Slide Creation)
- 网页生成(Web Page)
- 图像生成(Image Generation)
- 视频生成(Video Generation)
你可以添加自己的Skill :把 SKILL.md 放到 skills/custom/ 目录下。
2. Sub-Agents ------ 并行干活的小分队
复杂任务会被拆解,由多个Sub-Agent并行执行。
text
你的提问:"做一个AI视频工具的市场分析"
│
▼
Lead Agent(拆解任务)
├── Sub-Agent 1: "调研Runway的技术路线"
├── Sub-Agent 2: "调研Pika的定价策略"
├── Sub-Agent 3: "调研Kling的用户反馈"
├── Sub-Agent 4: "调研Veo的市场份额"
└── Sub-Agent 5: "整理行业趋势数据"
│
▼
并行执行 → 汇总 → 输出完整报告
每个Sub-Agent:
- 有自己的独立上下文
- 有自己的工具集
- 有自己的终止条件
- 可以并行运行
配置方式:在对话中说"使用ultra模式",就会启用Sub-Agent。
3. Sandbox与文件系统 ------ AI有自己的"电脑"
每个任务运行在隔离的Docker容器里,有完整的文件系统:
text
/mnt/user-data/
├── uploads/ ← 你上传的文件
├── workspace/ ← Agent的工作目录(读写文件、跑代码)
└── outputs/ ← 最终产出物(报告、PPT、图片)
Agent可以:
- 读写文件
- 执行Bash命令
- 运行Python代码
- 查看图片
- 生成和下载文件
沙箱的好处:
- 隔离:不同任务之间互不污染
- 安全:恶意代码不会影响宿主机
- 可审计:所有操作都有记录
💡 沙箱(Sandbox):一个隔离的执行环境,像"玻璃盒子"------里面的操作不会影响到外面。
4. 长期记忆 ------ 越用越懂你
大多数AI在对话结束后就忘记了一切。DeerFlow不一样。
- 跨会话记忆:它会在多次对话中积累关于你的偏好、知识背景、工作习惯
- 越用越懂:你的写作风格、技术栈、重复出现的工作流,都会被记住
- 本地存储:所有记忆保存在你自己电脑上,控制权在你手里
5. MCP Server ------ 跟任何AI工具互通
DeerFlow支持MCP协议,可以通过Claude Code、Cursor等工具调用它的能力。
示例(Claude Code):
bash
npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow
然后在Claude Code里用 /claude-to-deerflow 命令,就能把研究任务发给DeerFlow。
💡 MCP(模型上下文协议):一种让AI工具之间互相通信的标准协议。
6. IM渠道集成 ------ 在微信/飞书/钉钉里用
DeerFlow支持从即时通讯应用接收任务:
| 渠道 | 传输方式 |
|---|---|
| Telegram | Bot API |
| Slack | Socket Mode |
| 飞书/Lark | WebSocket |
| 企业微信 | WebSocket |
| 钉钉 | WebSocket |
你在聊天里发消息,DeerFlow在后台执行,结果回到聊天里。不需要公网IP。
7. LangSmith链路追踪 ------ 看清楚每一步
启用LangSmith后,所有LLM调用、Agent运行、工具执行都可以在仪表盘里追踪。
在 .env 里设置:
bash
LANGSMITH_TRACING=true
LANGSMITH_API_KEY=lsv2_pt_xxxx
🚀 怎么用?
安装(推荐Docker)
bash
git clone 项目地址
cd deer-flow
make config
make docker-init
make docker-start
访问:http://localhost:2026
配置模型
编辑 config.yaml,至少配置一个模型:
yaml
models:
- name: deepseek
display_name: DeepSeek
use: langchain_openai:ChatOpenAI
model: deepseek-chat
api_key: $DEEPSEEK_API_KEY
推荐模型(DeerFlow官方推荐):
- Doubao-Seed-2.0-Code(字节自家)
- DeepSeek v3.2
- Kimi 2.5
开始使用
在网页界面输入:
"帮我调研一下DeerFlow的主要竞品,做一份对比报告"
DeerFlow会拆解任务、并行执行、输出结果。
🎯 谁最适合用?
| 人群 | 为什么适合 |
|---|---|
| 研究员/分析师 | 自动做深度调研,多方向并行,节省大量时间 |
| 产品经理/创业者 | 快速生成市场分析报告、竞品调研 |
| 开发者 | 用Sub-Agent做技术调研、代码分析、文档生成 |
| 内容创作者 | 研究+写作+PPT生成一条龙 |
| 企业IT/数据团队 | 自动化数据分析和报告生成 |
| 在飞书/钉钉/企业微信里工作的团队 | 直接在聊天里调用DeerFlow做研究 |
🔒 安全提醒
DeerFlow具备执行命令、操作文件等高权限能力。
- 默认只在本地回环(127.0.0.1)访问
- 如果部署到公网,必须加访问控制(IP白名单、身份验证)
- 不建议暴露到不可信的局域网
🔗 链接
- GitHub:github.com/bytedance/deer-flow
- 官网:deerflow.tech
- 许可证:MIT
✅ 总结
| 层次 | 核心内容 |
|---|---|
| 解决了什么 | AI能回答但做不完"研究类"复杂任务。DeerFlow用Sub-Agent并行+沙箱+记忆,让AI能独立完成从研究到产出的全过程 |
| 核心能力 | ①Skills扩展 ②Sub-Agent并行 ③沙箱隔离 ④长期记忆 ⑤MCP互通 ⑥IM渠道集成 |
| 怎么用 | Docker一键启动,网页对话,或集成到飞书/钉钉/企业微信 |
| 谁适合 | 研究员、产品经理、开发者、内容创作者、企业IT团队 |
DeerFlow ------ 字节跳动开源,MIT协议。
让AI从"问答工具"变成"任务执行者"。