Windows直接部署crawlab

1. 拉取代码

python 复制代码
git clone https://github.com/crawlab-team/crawlab

2. 安装 Node 环境

bash 复制代码
https://github.com/coreybutler/nvm-windows/releases
bash 复制代码
nvm install 20.18.0
nvm use 20.18.0

3.安装MongoDB

bash 复制代码
https://www.mongodb.com/try/download/community

4.安装Redis

bash 复制代码
https://www.runoob.com/redis/redis-install.html

5.安装前后端

5.1 安装前端所需库

bash 复制代码
npm install -g serve

cd frontend

bash 复制代码
npm install

5.2 修改后端配置

bash 复制代码
crawlab/backend/conf
bash 复制代码
api:
  address: "http://localhost:8000"  # API 地址
mongo:
  host: 127.0.0.1  # MongoDB host
  port: 27017  # MongoDB port
  db: crawlab_test  # MongoDB database
  username: ""  # MongoDB username
  password: ""  # MongoDB password
  authSource: "admin"  # MongoDB auth source database
redis:
  address: 127.0.0.1  # Redis host
  password: ""  # Redis password
  database: 1  # Redis database
  port: 6379  # Redis port
log:
  level: info  # Log Level
  path: "/var/logs/crawlab"  # Log Path
  isDeletePeriodically: "N"  # 是否定期删除日志(默认为否)
  deleteFrequency: "@hourly"  # 删除日志频率
server:
  host: 0.0.0.0  # 后端监听地址
  port: 8000  # 后端监听端口
  master: "Y"  # 是否为主节点
  secret: "crawlab"  # JWT secret
  register:
    # mac地址 或者 ip地址,如果是ip,则需要手动指定IP
    type: "mac"
    ip: ""
  lang: # 安装语言环境, Y 为安装,N 为不安装
    python: "Y"
    node: "N"
    java: "N"
    dotnet: "N"
spider:
  path: "/app/spiders"  # 爬虫路径
task:
  workers: 4  # 同时运行任务的执行器数量
other:
  tmppath: "/tmp"  # 临时文件目录
version: 0.4.7  # 版本号
setting:
  allowRegister: "N"  # 是否允许注册
  enableTutorial: "N"  # 是否弃用教程
  runOnMaster: "Y"  # 是否在主节点上运行任务
  demoSpiders: "N"  # 是否加载demo爬虫
  checkScrapy: "Y"  # 是否自动检查Scrapy
notification: # 消息通知
  mail: # 邮箱通知
    server: '' # SMPT 服务器地址
    port: ''  # SMTP 服务器端口
    senderEmail: ''  # 发送者邮箱
    senderIdentity: ''  # 发送者身份
    smtp:  # SMTP
      user: ''  # SMTP 用户名
      password: ''  # SMTP 密码

参考配置https://docs-v05.crawlab.cn/zh/Config/

5.3 安装后端

bash 复制代码
cd ../backend
go install ./...

5.4 设置master节点

bash 复制代码
C:\Users\用户名\.crawlab\config.json

将配置中is_master 改为true

这一步主要解决启动不是master节点导致服务无法启动问题

bash 复制代码
info current node type: worker
context deadline exceeded

5.5 启动后端

bash 复制代码
$env:CRAWLAB_NODE_MASTER="true"
go run main.go server

5.6 启动前端

bash 复制代码
# 本地环境运行
npm run serve

# 生产环境运行
npm run build
npm run serve:dist

6.安装Nginx

bash 复制代码
https://nginx.org/en/download.html

项目地址 https://github.com/Cocktailpy/crawlab

参考 Crawlab 中文文档

相关推荐
黄忠41 分钟前
01-系统架构设计-LangGraph状态机与多源异构RAG
python
zzzzzz3101 小时前
假如我是掘金管理员,我先给评论区装个'代码审查'系统
python·程序员·机器人
砍材农夫1 小时前
python环境|conda安装和使用(2)
后端·python
程序员龙叔14 小时前
编写高质量 Skill 系列 -- 如何设计需求分析与用例生成的 SKILL
自动化测试·软件测试·python·软件测试工程师·接口测试·性能测试·skill·ai测试
用户83562907805117 小时前
使用 Python 操作 Word 内容控件
后端·python
qq_3692243318 小时前
Windows全系通用!ntdll.dll文件丢失、报错、闪退问题的完整排查与修复教程
windows·dll·dll修复·dll丢失·dll错误
码云骑士18 小时前
32-慢查询排查全流程(下)-索引优化实战与最左前缀原则
python
何以解忧,唯有..18 小时前
Go语言循环语句详解:for、range与循环控制
开发语言·算法·golang
闵孚龙19 小时前
《PyTorch 深度修炼》Dataset 和 DataLoader:数据如何喂给模型
人工智能·pytorch·python