字节开源DeerFlow：一个命令，AI自动做研究、写报告、做PPT

从"问AI"到"AI自己干活"------研究、分析、生成全自动

支持Sub-Agents并行、沙箱隔离、跨会话记忆

登上GitHub Trending全球第一

🔍 先看痛点：AI能做研究，但做不完

你想让AI帮你做一份深度的市场研究报告、技术调研、或者竞品分析。

你跟ChatGPT说：

"帮我研究一下量子计算的行业现状"

它会给你一份答案。看起来不错，但：

信息可能过时（训练数据截止日之前）
深度不够（只能给你概括，做不到几十页的报告）
不能出成果（只能给你文字，不能给你一份PPT、一个网站、一个数据看板）
一次只能做一个任务（不能同时探索10个方向再汇总）

核心矛盾：

AI能回答问题和写摘要，但做不了真正的研究工作------那种需要多轮搜索、交叉验证、多方向并行探索、最终产出一个"成果"的复杂任务。

✅ DeerFlow 的解法

DeerFlow（Deep Exploration and Efficient Research Flow）是字节跳动开源的一个"超级AI代理工具包"。

一句话：给AI一台"自己的电脑"，让它自己拆任务、自己干活、自己出成果

bash 复制代码

# 安装和启动
git clone 项目地址
cd deer-flow
make config
make dev

然后你访问 http://localhost:2026，跟它说：

"帮我做一份关于AI视频生成工具的市场分析报告，包含主要玩家、技术路线、定价对比和未来趋势"

DeerFlow会：

拆解任务：自动分成10多个子任务
并行执行：每个子任务由一个独立的"Sub-Agent"负责
各自探索：每个Sub-Agent有自己的搜索工具、分析能力
汇总整合：最后合并成一份完整报告
输出成果：可以是Markdown报告、幻灯片、甚至一个网页

你需要的不是答案，是完成一个任务。DeerFlow帮你完成它。

🔥 它解决了什么？

1. "一次一个答案" vs "多路并行研究"

	传统ChatGPT式对话	DeerFlow
任务拆分	你要自己分步问	✅ AI自动拆解
并行能力	一次只能做一件事	✅ 同时跑多个Sub-Agent
深度	受限于单次对话	✅ 每个方向都能深入探索
成果	文字回答	✅ 报告、PPT、网页、数据看板

2. "问完就忘" vs "有记忆、有环境"

	传统AI	DeerFlow
跨会话记忆	❌ 每次重新开始	✅ 长期记忆（偏好、知识、工作习惯）
文件系统	❌ 没有自己的"电脑"	✅ 每个任务有隔离的沙箱（有硬盘、能跑代码）
执行能力	只能"说"	✅ 能读文件、写文件、执行bash命令
成果沉淀	在对话框里	✅ 产出可下载的文件、可访问的网页

3. 单一Agent vs 多Sub-Agent协作

一个复杂任务，比如"调研全球AI视频生成工具"：

	单Agent	DeerFlow多Sub-Agent
并行度	0（只能串行）	✅ 10个同时跑
成本	总耗时=所有任务耗时之和	✅ 总耗时≈最长那个子任务
深度	浅（受限于上下文）	✅ 每个方向都有独立上下文
抗干扰	容易被中间信息带偏	✅ 每个Agent只关注自己的任务

📦 核心能力

1. Skills与Tools ------ 让AI"什么都能做"

Skills是DeerFlow能做"几乎任何事情"的关键。每个Skill是一个结构化Markdown文件，里面定义了：

这个任务怎么做
需要什么工具
有什么注意事项
输出什么格式

内置Skills：

研究（Research）
报告生成（Report Generation）
幻灯片创建（Slide Creation）
网页生成（Web Page）
图像生成（Image Generation）
视频生成（Video Generation）

你可以添加自己的Skill ：把 SKILL.md 放到 skills/custom/ 目录下。

2. Sub-Agents ------ 并行干活的小分队

复杂任务会被拆解，由多个Sub-Agent并行执行。

text 复制代码

你的提问："做一个AI视频工具的市场分析"
         │
         ▼
    Lead Agent（拆解任务）
    ├── Sub-Agent 1: "调研Runway的技术路线"
    ├── Sub-Agent 2: "调研Pika的定价策略"
    ├── Sub-Agent 3: "调研Kling的用户反馈"
    ├── Sub-Agent 4: "调研Veo的市场份额"
    └── Sub-Agent 5: "整理行业趋势数据"
         │
         ▼
    并行执行 → 汇总 → 输出完整报告

每个Sub-Agent：

有自己的独立上下文
有自己的工具集
有自己的终止条件
可以并行运行

配置方式：在对话中说"使用ultra模式"，就会启用Sub-Agent。

3. Sandbox与文件系统 ------ AI有自己的"电脑"

每个任务运行在隔离的Docker容器里，有完整的文件系统：

text 复制代码

/mnt/user-data/
├── uploads/          ← 你上传的文件
├── workspace/        ← Agent的工作目录（读写文件、跑代码）
└── outputs/          ← 最终产出物（报告、PPT、图片）

Agent可以：

读写文件
执行Bash命令
运行Python代码
查看图片
生成和下载文件

沙箱的好处：

隔离：不同任务之间互不污染
安全：恶意代码不会影响宿主机
可审计：所有操作都有记录

💡 沙箱（Sandbox）：一个隔离的执行环境，像"玻璃盒子"------里面的操作不会影响到外面。

4. 长期记忆 ------ 越用越懂你

大多数AI在对话结束后就忘记了一切。DeerFlow不一样。

跨会话记忆：它会在多次对话中积累关于你的偏好、知识背景、工作习惯
越用越懂：你的写作风格、技术栈、重复出现的工作流，都会被记住
本地存储：所有记忆保存在你自己电脑上，控制权在你手里

5. MCP Server ------ 跟任何AI工具互通

DeerFlow支持MCP协议，可以通过Claude Code、Cursor等工具调用它的能力。

示例（Claude Code）：

bash 复制代码

npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow

然后在Claude Code里用 /claude-to-deerflow 命令，就能把研究任务发给DeerFlow。

💡 MCP（模型上下文协议）：一种让AI工具之间互相通信的标准协议。

6. IM渠道集成 ------ 在微信/飞书/钉钉里用

DeerFlow支持从即时通讯应用接收任务：

渠道	传输方式
Telegram	Bot API
Slack	Socket Mode
飞书/Lark	WebSocket
企业微信	WebSocket
钉钉	WebSocket

你在聊天里发消息，DeerFlow在后台执行，结果回到聊天里。不需要公网IP。

7. LangSmith链路追踪 ------ 看清楚每一步

启用LangSmith后，所有LLM调用、Agent运行、工具执行都可以在仪表盘里追踪。

在 .env 里设置：

bash 复制代码

LANGSMITH_TRACING=true
LANGSMITH_API_KEY=lsv2_pt_xxxx

🚀 怎么用？

安装（推荐Docker）

bash 复制代码

git clone 项目地址
cd deer-flow
make config
make docker-init
make docker-start

访问：http://localhost:2026

配置模型

编辑 config.yaml，至少配置一个模型：

yaml 复制代码

models:
  - name: deepseek
    display_name: DeepSeek
    use: langchain_openai:ChatOpenAI
    model: deepseek-chat
    api_key: $DEEPSEEK_API_KEY

推荐模型（DeerFlow官方推荐）：

Doubao-Seed-2.0-Code（字节自家）
DeepSeek v3.2
Kimi 2.5

开始使用

在网页界面输入：

"帮我调研一下DeerFlow的主要竞品，做一份对比报告"

DeerFlow会拆解任务、并行执行、输出结果。

🎯 谁最适合用？

人群	为什么适合
研究员/分析师	自动做深度调研，多方向并行，节省大量时间
产品经理/创业者	快速生成市场分析报告、竞品调研
开发者	用Sub-Agent做技术调研、代码分析、文档生成
内容创作者	研究+写作+PPT生成一条龙
企业IT/数据团队	自动化数据分析和报告生成
在飞书/钉钉/企业微信里工作的团队	直接在聊天里调用DeerFlow做研究

🔒 安全提醒

DeerFlow具备执行命令、操作文件等高权限能力。

默认只在本地回环（127.0.0.1）访问
如果部署到公网，必须加访问控制（IP白名单、身份验证）
不建议暴露到不可信的局域网

🔗 链接

GitHub：github.com/bytedance/deer-flow
官网：deerflow.tech
许可证：MIT

✅ 总结

层次	核心内容
解决了什么	AI能回答但做不完"研究类"复杂任务。DeerFlow用Sub-Agent并行+沙箱+记忆，让AI能独立完成从研究到产出的全过程
核心能力	①Skills扩展 ②Sub-Agent并行 ③沙箱隔离 ④长期记忆 ⑤MCP互通 ⑥IM渠道集成
怎么用	Docker一键启动，网页对话，或集成到飞书/钉钉/企业微信
谁适合	研究员、产品经理、开发者、内容创作者、企业IT团队

DeerFlow ------ 字节跳动开源，MIT协议。

让AI从"问答工具"变成"任务执行者"。