字节开源DeerFlow:一个命令,AI自动做研究、写报告、做PPT

从"问AI"到"AI自己干活"------研究、分析、生成全自动

支持Sub-Agents并行、沙箱隔离、跨会话记忆

登上GitHub Trending全球第一


🔍 先看痛点:AI能做研究,但做不完

你想让AI帮你做一份深度的市场研究报告、技术调研、或者竞品分析。

你跟ChatGPT说:

"帮我研究一下量子计算的行业现状"

它会给你一份答案。看起来不错,但:

  • 信息可能过时(训练数据截止日之前)
  • 深度不够(只能给你概括,做不到几十页的报告)
  • 不能出成果(只能给你文字,不能给你一份PPT、一个网站、一个数据看板)
  • 一次只能做一个任务(不能同时探索10个方向再汇总)

核心矛盾

AI能回答问题和写摘要,但做不了真正的研究工作------那种需要多轮搜索、交叉验证、多方向并行探索、最终产出一个"成果"的复杂任务。


✅ DeerFlow 的解法

DeerFlow(Deep Exploration and Efficient Research Flow)是字节跳动开源的一个"超级AI代理工具包"。

一句话:给AI一台"自己的电脑",让它自己拆任务、自己干活、自己出成果

bash 复制代码
# 安装和启动
git clone 项目地址
cd deer-flow
make config
make dev

然后你访问 http://localhost:2026,跟它说:

"帮我做一份关于AI视频生成工具的市场分析报告,包含主要玩家、技术路线、定价对比和未来趋势"

DeerFlow会:

  1. 拆解任务:自动分成10多个子任务
  2. 并行执行:每个子任务由一个独立的"Sub-Agent"负责
  3. 各自探索:每个Sub-Agent有自己的搜索工具、分析能力
  4. 汇总整合:最后合并成一份完整报告
  5. 输出成果:可以是Markdown报告、幻灯片、甚至一个网页

你需要的不是答案,是完成一个任务。DeerFlow帮你完成它。


🔥 它解决了什么?

1. "一次一个答案" vs "多路并行研究"

传统ChatGPT式对话 DeerFlow
任务拆分 你要自己分步问 ✅ AI自动拆解
并行能力 一次只能做一件事 ✅ 同时跑多个Sub-Agent
深度 受限于单次对话 ✅ 每个方向都能深入探索
成果 文字回答 ✅ 报告、PPT、网页、数据看板

2. "问完就忘" vs "有记忆、有环境"

传统AI DeerFlow
跨会话记忆 ❌ 每次重新开始 ✅ 长期记忆(偏好、知识、工作习惯)
文件系统 ❌ 没有自己的"电脑" ✅ 每个任务有隔离的沙箱(有硬盘、能跑代码)
执行能力 只能"说" ✅ 能读文件、写文件、执行bash命令
成果沉淀 在对话框里 ✅ 产出可下载的文件、可访问的网页

3. 单一Agent vs 多Sub-Agent协作

一个复杂任务,比如"调研全球AI视频生成工具":

单Agent DeerFlow多Sub-Agent
并行度 0(只能串行) ✅ 10个同时跑
成本 总耗时=所有任务耗时之和 ✅ 总耗时≈最长那个子任务
深度 浅(受限于上下文) ✅ 每个方向都有独立上下文
抗干扰 容易被中间信息带偏 ✅ 每个Agent只关注自己的任务

📦 核心能力

1. Skills与Tools ------ 让AI"什么都能做"

Skills是DeerFlow能做"几乎任何事情"的关键。每个Skill是一个结构化Markdown文件,里面定义了:

  • 这个任务怎么做
  • 需要什么工具
  • 有什么注意事项
  • 输出什么格式

内置Skills

  • 研究(Research)
  • 报告生成(Report Generation)
  • 幻灯片创建(Slide Creation)
  • 网页生成(Web Page)
  • 图像生成(Image Generation)
  • 视频生成(Video Generation)

你可以添加自己的Skill :把 SKILL.md 放到 skills/custom/ 目录下。

2. Sub-Agents ------ 并行干活的小分队

复杂任务会被拆解,由多个Sub-Agent并行执行。

text 复制代码
你的提问:"做一个AI视频工具的市场分析"
         │
         ▼
    Lead Agent(拆解任务)
    ├── Sub-Agent 1: "调研Runway的技术路线"
    ├── Sub-Agent 2: "调研Pika的定价策略"
    ├── Sub-Agent 3: "调研Kling的用户反馈"
    ├── Sub-Agent 4: "调研Veo的市场份额"
    └── Sub-Agent 5: "整理行业趋势数据"
         │
         ▼
    并行执行 → 汇总 → 输出完整报告

每个Sub-Agent:

  • 有自己的独立上下文
  • 有自己的工具集
  • 有自己的终止条件
  • 可以并行运行

配置方式:在对话中说"使用ultra模式",就会启用Sub-Agent。

3. Sandbox与文件系统 ------ AI有自己的"电脑"

每个任务运行在隔离的Docker容器里,有完整的文件系统:

text 复制代码
/mnt/user-data/
├── uploads/          ← 你上传的文件
├── workspace/        ← Agent的工作目录(读写文件、跑代码)
└── outputs/          ← 最终产出物(报告、PPT、图片)

Agent可以:

  • 读写文件
  • 执行Bash命令
  • 运行Python代码
  • 查看图片
  • 生成和下载文件

沙箱的好处

  • 隔离:不同任务之间互不污染
  • 安全:恶意代码不会影响宿主机
  • 可审计:所有操作都有记录

💡 沙箱(Sandbox):一个隔离的执行环境,像"玻璃盒子"------里面的操作不会影响到外面。

4. 长期记忆 ------ 越用越懂你

大多数AI在对话结束后就忘记了一切。DeerFlow不一样。

  • 跨会话记忆:它会在多次对话中积累关于你的偏好、知识背景、工作习惯
  • 越用越懂:你的写作风格、技术栈、重复出现的工作流,都会被记住
  • 本地存储:所有记忆保存在你自己电脑上,控制权在你手里

5. MCP Server ------ 跟任何AI工具互通

DeerFlow支持MCP协议,可以通过Claude Code、Cursor等工具调用它的能力。

示例(Claude Code)

bash 复制代码
npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow

然后在Claude Code里用 /claude-to-deerflow 命令,就能把研究任务发给DeerFlow。

💡 MCP(模型上下文协议):一种让AI工具之间互相通信的标准协议。

6. IM渠道集成 ------ 在微信/飞书/钉钉里用

DeerFlow支持从即时通讯应用接收任务:

渠道 传输方式
Telegram Bot API
Slack Socket Mode
飞书/Lark WebSocket
企业微信 WebSocket
钉钉 WebSocket

你在聊天里发消息,DeerFlow在后台执行,结果回到聊天里。不需要公网IP。

7. LangSmith链路追踪 ------ 看清楚每一步

启用LangSmith后,所有LLM调用、Agent运行、工具执行都可以在仪表盘里追踪。

.env 里设置:

bash 复制代码
LANGSMITH_TRACING=true
LANGSMITH_API_KEY=lsv2_pt_xxxx

🚀 怎么用?

安装(推荐Docker)

bash 复制代码
git clone 项目地址
cd deer-flow
make config
make docker-init
make docker-start

访问:http://localhost:2026

配置模型

编辑 config.yaml,至少配置一个模型:

yaml 复制代码
models:
  - name: deepseek
    display_name: DeepSeek
    use: langchain_openai:ChatOpenAI
    model: deepseek-chat
    api_key: $DEEPSEEK_API_KEY

推荐模型(DeerFlow官方推荐):

  • Doubao-Seed-2.0-Code(字节自家)
  • DeepSeek v3.2
  • Kimi 2.5

开始使用

在网页界面输入:

"帮我调研一下DeerFlow的主要竞品,做一份对比报告"

DeerFlow会拆解任务、并行执行、输出结果。


🎯 谁最适合用?

人群 为什么适合
研究员/分析师 自动做深度调研,多方向并行,节省大量时间
产品经理/创业者 快速生成市场分析报告、竞品调研
开发者 用Sub-Agent做技术调研、代码分析、文档生成
内容创作者 研究+写作+PPT生成一条龙
企业IT/数据团队 自动化数据分析和报告生成
在飞书/钉钉/企业微信里工作的团队 直接在聊天里调用DeerFlow做研究

🔒 安全提醒

DeerFlow具备执行命令、操作文件等高权限能力。

  • 默认只在本地回环(127.0.0.1)访问
  • 如果部署到公网,必须加访问控制(IP白名单、身份验证)
  • 不建议暴露到不可信的局域网

🔗 链接


✅ 总结

层次 核心内容
解决了什么 AI能回答但做不完"研究类"复杂任务。DeerFlow用Sub-Agent并行+沙箱+记忆,让AI能独立完成从研究到产出的全过程
核心能力 ①Skills扩展 ②Sub-Agent并行 ③沙箱隔离 ④长期记忆 ⑤MCP互通 ⑥IM渠道集成
怎么用 Docker一键启动,网页对话,或集成到飞书/钉钉/企业微信
谁适合 研究员、产品经理、开发者、内容创作者、企业IT团队

DeerFlow ------ 字节跳动开源,MIT协议。

让AI从"问答工具"变成"任务执行者"。