Windows直接部署crawlab

1. 拉取代码

python 复制代码
git clone https://github.com/crawlab-team/crawlab

2. 安装 Node 环境

bash 复制代码
https://github.com/coreybutler/nvm-windows/releases
bash 复制代码
nvm install 20.18.0
nvm use 20.18.0

3.安装MongoDB

bash 复制代码
https://www.mongodb.com/try/download/community

4.安装Redis

bash 复制代码
https://www.runoob.com/redis/redis-install.html

5.安装前后端

5.1 安装前端所需库

bash 复制代码
npm install -g serve

cd frontend

bash 复制代码
npm install

5.2 修改后端配置

bash 复制代码
crawlab/backend/conf
bash 复制代码
api:
  address: "http://localhost:8000"  # API 地址
mongo:
  host: 127.0.0.1  # MongoDB host
  port: 27017  # MongoDB port
  db: crawlab_test  # MongoDB database
  username: ""  # MongoDB username
  password: ""  # MongoDB password
  authSource: "admin"  # MongoDB auth source database
redis:
  address: 127.0.0.1  # Redis host
  password: ""  # Redis password
  database: 1  # Redis database
  port: 6379  # Redis port
log:
  level: info  # Log Level
  path: "/var/logs/crawlab"  # Log Path
  isDeletePeriodically: "N"  # 是否定期删除日志(默认为否)
  deleteFrequency: "@hourly"  # 删除日志频率
server:
  host: 0.0.0.0  # 后端监听地址
  port: 8000  # 后端监听端口
  master: "Y"  # 是否为主节点
  secret: "crawlab"  # JWT secret
  register:
    # mac地址 或者 ip地址,如果是ip,则需要手动指定IP
    type: "mac"
    ip: ""
  lang: # 安装语言环境, Y 为安装,N 为不安装
    python: "Y"
    node: "N"
    java: "N"
    dotnet: "N"
spider:
  path: "/app/spiders"  # 爬虫路径
task:
  workers: 4  # 同时运行任务的执行器数量
other:
  tmppath: "/tmp"  # 临时文件目录
version: 0.4.7  # 版本号
setting:
  allowRegister: "N"  # 是否允许注册
  enableTutorial: "N"  # 是否弃用教程
  runOnMaster: "Y"  # 是否在主节点上运行任务
  demoSpiders: "N"  # 是否加载demo爬虫
  checkScrapy: "Y"  # 是否自动检查Scrapy
notification: # 消息通知
  mail: # 邮箱通知
    server: '' # SMPT 服务器地址
    port: ''  # SMTP 服务器端口
    senderEmail: ''  # 发送者邮箱
    senderIdentity: ''  # 发送者身份
    smtp:  # SMTP
      user: ''  # SMTP 用户名
      password: ''  # SMTP 密码

参考配置https://docs-v05.crawlab.cn/zh/Config/

5.3 安装后端

bash 复制代码
cd ../backend
go install ./...

5.4 设置master节点

bash 复制代码
C:\Users\用户名\.crawlab\config.json

将配置中is_master 改为true

这一步主要解决启动不是master节点导致服务无法启动问题

bash 复制代码
info current node type: worker
context deadline exceeded

5.5 启动后端

bash 复制代码
$env:CRAWLAB_NODE_MASTER="true"
go run main.go server

5.6 启动前端

bash 复制代码
# 本地环境运行
npm run serve

# 生产环境运行
npm run build
npm run serve:dist

6.安装Nginx

bash 复制代码
https://nginx.org/en/download.html

项目地址 https://github.com/Cocktailpy/crawlab

参考 Crawlab 中文文档

相关推荐
小L~~~5 小时前
基于贪心策略的混合遗传算法求解01背包问题
python·算法
才兄说6 小时前
机器人二次开发机器人动作定制?动作迁移数据优化
python
jieyucx6 小时前
Go 语言 sort 包详解:从基础排序到自定义排序(含底层原理+零基础看懂)
算法·golang·排序算法·sort
用户8356290780516 小时前
用 Python 实现 Excel 散点图绘制与定制
后端·python
PAK向日葵6 小时前
从零实现 Python 虚拟机(一):PVM 基本原理介绍
python
神所夸赞的夏天6 小时前
创建虚拟环境提示SSLError错误
python
极光代码工作室6 小时前
基于机器学习的二手商品价格预测系统
人工智能·python·深度学习·机器学习
无情的西瓜皮6 小时前
MCP协议实战:从零搭建一个AI Agent工具服务器
运维·服务器·python
fengchengwu20127 小时前
Jupyter 安装与使用指南:从环境配置到效率翻倍
ide·windows·jupyter
IT策士7 小时前
Django 从 0 到 1 打造完整电商平台:系列总结 + 项目演示与后续扩展
后端·python·django