本地部署 Firecrawl

本地部署 Firecrawl

本文档概述了如何本地部署 Firecrawl。

为什么要本地部署?

  • 增强安全性和合规性: 数据处理和存储完全在您的控制之下,符合内部和外部法规。Firecrawl 作为 Mendable 产品,依赖于 SOC2 Type2 认证,保证了高数据安全标准。
  • 可定制的服务: 可以根据特定需求定制服务,例如 Playwright 服务。
  • 深入学习和社区贡献: 深入了解 Firecrawl 的工作原理,更有助于贡献代码。

注意事项:

  • Fire-engine 访问受限: 自行部署的实例无法访问 Fire-engine,这意味着无法使用 IP 封锁、机器人检测等高级功能。
  • 手动配置: 需要手动配置 .env 文件以支持基本 fetch 和 Playwright 之外的抓取方法。

部署步骤:

  1. 克隆代码

    git clone https://github.com/mendableai/firecrawl.git

  2. 设置环境变量:

    • 创建根目录下的 .env 文件,使用以下模板:

    ===== Required ENVS ======

    PORT=3002
    HOST=0.0.0.0

    To turn on DB authentication, you need to set up Supabase.

    USE_DB_AUTHENTICATION=false

    ===== Optional ENVS ======

    OpenAI API Key (用于 AI 功能)

    OPENAI_API_KEY=

    Ollama (实验性)

    OLLAMA_BASE_URL=http://localhost:11434/api

    MODEL_NAME=deepseek-r1:7b

    MODEL_EMBEDDING_NAME=nomic-embed-text

    OpenAI 兼容 API (实验性)

    OPENAI_BASE_URL=https://example.com/v1

    OPENAI_API_KEY=

    代理设置

    PROXY_SERVER=

    PROXY_USERNAME=

    PROXY_PASSWORD=

    SearXNG API (用于 /search API)

    SEARXNG_ENDPOINT=http://your.searxng.server

    SEARXNG_ENGINES=

    SEARXNG_CATEGORIES=

    Supabase 设置 (用于数据库认证等)

    SUPABASE_ANON_TOKEN=

    SUPABASE_URL=

    SUPABASE_SERVICE_TOKEN=

    测试 API 密钥

    TEST_API_KEY=

    ScrapingBee API 密钥 (作为备用抓取引擎)

    SCRAPING_BEE_API_KEY=

    Bull Queue 管理员密钥 (请修改默认值)

    BULL_AUTH_KEY=CHANGEME

    (Docker Compose 自动配置,无需手动设置)

    PLAYWRIGHT_MICROSERVICE_URL=http://playwright-service:3000/scrape

    REDIS_URL=redis://redis:6379

    REDIS_RATE_LIMIT_URL=redis://redis:6379

    Llamaparse API 密钥 (用于 PDF 解析)

    LLAMAPARSE_API_KEY=

    Slack Webhook URL (用于健康状态通知)

    SLACK_WEBHOOK_URL=

    Posthog API Key (用于事件跟踪)

    POSTHOG_API_KEY=

    POSTHOG_HOST=

  3. 构建并运行 Docker 容器:

bash 复制代码
docker compose build
docker compose up -d
  1. 访问 Firecrawl: 在浏览器中访问 http://localhost:3002
  2. Bull Queue 管理员界面: 在浏览器中访问 http://localhost:3002/admin/CHANGEME/queues (请务必修改 BULL_AUTH_KEY)。

API 测试 (可选):

bash 复制代码
curl -X POST http://localhost:3002/v1/crawl \
    -H 'Content-Type: application/json' \
    -d '{
      "url": "https://firecrawl.dev"
    }'

常见问题及解决方案:

  • API 密钥: 使用 SDK 时,API 密钥是可选的,仅在连接云服务时需要。
  • Supabase 未配置: 目前自行部署的实例不支持 Supabase 配置,但可以正常抓取和爬取。
  • Docker 容器启动失败: 检查 Docker 日志 (docker logs [container_name]),确保环境变量设置正确,以及 Docker Compose 文件配置正确。
  • Redis 连接问题: 确保 Redis 服务运行,.env 文件中的 REDIS_URLREDIS_RATE_LIMIT_URL 设置正确,并且网络配置允许连接。
  • API 接口无响应: 检查 Firecrawl 服务是否运行,PORTHOST 设置是否正确,以及网络配置。
相关推荐
Emmamkq~~18 小时前
造相-Z-Image技术白皮书精要:Z-Image模型结构与4090适配原理
文生图·ai绘画·本地部署·gpu优化
Fleshy数模1 天前
本地部署 Qwen2.5-1.5B-Instruct 全流程教程|Ollama + 魔搭双方案
python·语言模型·大模型·本地部署
康de哥2 天前
【一站式】本地部署Gemma 4 + 连接OpenCode
本地部署·opencode·gemma4
韩明君6 天前
OpenClaw安全部署实现
linux·人工智能·安全·debian·本地部署·ai agent·openclaw
comedate18 天前
【OpenClaw】 8GB 显卡本地大模型部署指南
大模型·本地部署·ollama·vibe coding
AI_DL_CODE20 天前
【OpenClaw从入门到精通】第01篇:保姆级教程——从零开始搭建你的第一个本地AI助理(2026实测版)
本地部署·开源工具·新手教程·ai代理·阿里云百炼·skills·openclaw
盘古开天166623 天前
Gemma4本地部署,零成本打造私有 AI 助手
人工智能·本地部署·智能体·gemma4·ai私有助理
旺财矿工1 个月前
openclaw一键安装包,配置好了大模型可以直接使用
本地部署·ai智能体·数字员工·ai自动化·openclaw·小龙虾
加斯顿工程师1 个月前
Windows系统使用Ollama本地化部署Qwen3.5-9B模型教程
windows·大模型·本地部署·ollama·qwen3.5
墨10242 个月前
一文教你OpenClaw Docker 部署并调用本地Qwen3.5 9B模型
docker·ai·本地部署·ollama·openclaw·qwen3.5