【GitHub每日速递 250929】告别手动查资料!这两个开源项目(17.8k+星)让 AI 帮你做深度研究,报告自动生成

原文:https://mp.weixin.qq.com/s/uxRt8xAdWX59n3RkoDJ5Vg

AI + 搜索引擎 = 无敌研究助手?这个开源项目让深度调研效率翻倍

项目概述

Open Deep Research 是一个基于 AI 的研究助手,通过结合搜索引擎、网页抓取和大型语言模型,对任何主题进行迭代式深度研究。该项目旨在提供深度研究代理的最简单实现,目标是将仓库大小控制在 500 行代码以内,以便于理解和扩展。

项目地址:https://github.com/dzhng/deep-research

主要语言:TypeScript

stars: 17.8k

核心功能

  • 迭代研究:通过迭代生成搜索查询、处理结果并基于发现进行深入研究
  • 智能查询生成:使用 LLM 根据研究目标和先前发现生成有针对性的搜索查询
  • 深度与广度控制:可配置的参数控制研究的广度和深度
  • 智能跟进:生成后续问题以更好地理解研究需求
  • 综合报告:生成包含发现和来源的详细 markdown 报告
  • 并发处理:并行处理多个搜索和结果,提高效率

工作原理

项目遵循以下工作流程:

  • 接收用户查询、广度参数和深度参数
  • 生成 SERP(搜索引擎结果页)查询
  • 处理搜索结果,提取学习内容和研究方向
  • 根据深度参数决定是否继续深入研究:
    • 如果深度 > 0,基于先前目标、新问题和学习内容生成下一个研究方向
    • 如果深度 = 0,生成最终的 markdown 报告

技术栈

  • 依赖库
    • @ai-sdk/fireworks@ai-sdk/openai:AI 模型集成
    • @mendable/firecrawl-js:网页搜索和内容提取
    • ai:AI 功能支持
    • express:可能用于构建 API 服务
    • p-limit:控制并发处理
    • zod:类型验证

环境要求

  • Node.js 环境(项目指定 Node.js 22.x)
  • 以下 API 密钥:
    • Firecrawl API(用于网页搜索和内容提取)
    • OpenAI API(用于 o3 mini 模型)

安装与设置

Node.js 方式

  • 克隆仓库
  • 安装依赖:npm install
  • .env.local 文件中设置环境变量(FIRECRAWL_KEY 等)

Docker 方式

  • 克隆仓库
  • .env.example 重命名为 .env.local 并设置 API 密钥
  • 构建镜像:docker build -f Dockerfile
  • 运行容器:docker compose up -d
  • 在容器中执行:docker exec -it deep-research npm run docker

社区实现

🦌 DeerFlow 仓库介绍

项目概述

DeerFlow(全称 Deep Exploration and Efficient Research Flow,即深度探索与高效研究流程)是一个社区驱动的深度研究框架,基于开源社区的杰出成果构建而成。其核心目标是将语言模型与网络搜索、爬虫、Python 代码执行等专业工具相结合,同时回馈开源社区。

项目地址:https://github.com/bytedance/deer-flow

主要语言:python

stars: 17.2k

主要特点

  • 无缝集成语言模型与各类专业工具,支持网页搜索、数据爬取、Python 代码执行等功能
  • 社区驱动,源于开源并回馈开源社区
  • 提供 Web UI 界面,便于用户操作使用
  • 支持生成全面的研究报告,还能基于报告创建播客音频等内容

应用场景

可用于多种深度研究任务,例如:

  • 分析热门技术(如 OpenAI Sora、Google 的 Agent to Agent 协议等)
  • 追踪 GitHub 热门仓库信息
  • 研究特定主题(如比特币价格波动、LLM 相关知识等)
  • 生成各类专题报告(如南京传统菜肴介绍、出租公寓装饰指南等)

部署与使用

  • 已正式入驻火山引擎的 FaaS 应用中心,用户可通过体验链接在线体验
  • 支持基于火山引擎一键部署
  • 也可本地部署,需满足 Python 3.12+ 和 Node.js 22+ 等环境要求,通过 git 克隆仓库后按照文档进行安装配置

相关资源

  • 官方网站:https://deerflow.tech/
  • 提供多语言文档,包括英文、简体中文、日本语、德语等
  • 仓库中包含多个示例研究报告和使用案例,帮助用户快速了解其功能和使用方法
相关推荐
猴子吃桃_Q3 天前
【GitHub每日速递 250926】12 周 24 课,边学边练!微软 AI 初学者的通关秘籍
github每日速递
猴子吃桃_Q4 天前
【GitHub每日速递 250925】 一套代码跑遍全平台!Flutter 让你的应用开发提速 10 倍
github每日速递
猴子吃桃_Q5 天前
【GitHub每日速递 250924】18 个 AI 投资大师齐上阵!这个开源对冲基金让你看透市场底牌
github每日速递
猴子吃桃_Q7 天前
【GitHub每日速递 250922】开源 AI 搜索引擎 Perplexica:本地大模型 + 多模式搜索,免费又强大!
github每日速递
猴子吃桃_Q10 天前
【GitHub每日速递 250919】MCP 生态新工具!Registry 服务器注册服务预览版,AI 开发者部署认证全流程揭秘
github每日速递
猴子吃桃_Q11 天前
【GitHub每日速递 250918】开发者必藏!336k 星标项目告诉你:前端 / 后端 / AI 岗该怎么学才高效
github每日速递
猴子吃桃_Q12 天前
【GitHub每日速递 250917】69k 星标!这个 MCP 服务器大集合,竟能解锁 AI 无限可能?
github每日速递
猴子吃桃_Q13 天前
【GitHub每日速递 250916】2053 个 n8n 工作流曝光!365 种集成 + 可视化管理,效率直接拉满
github每日速递
猴子吃桃_Q14 天前
【GitHub每日速递 250915】3 个宝藏开源项目:超长语音合成、算法学习库、自托管软件导航,开发者速收
github每日速递