Azkaban系列(一):Azkaban简介

前言

工作流调度器现在是每家公司必备,通过组织复杂的工作流计划,实现任务的自动触发,释放繁重的工作。

当前业界工作流调度系统也比较多,比如:airflow、apache oozie、azkaban等

首先,需要承认azkaban并不是一个完美的工作流调度器,但对于我们学习和熟悉分布式任务调度系统是值得借鉴的。

Azkaban整体介绍

Azkaban是LinkedIn开的的一个Java的工作流调度项目,主要负责任务的执行以及定时执行,是一个不错的调度系统。

工作流调度系统对比

以下对业界常见的工作流调度系统做一个对比

Azkaban架构介绍

整体架构

架构图如下:

Azkaban的架构比较简单,整体分为WebServer和ExectorServer,任务的元数据通过mysql来存储

当然,实际上项目会比这复杂,还是需要一定的耐心才能看懂整个项目

模块介绍

这里分别介绍一下各个模块

WebServer

WebServer是整个架构中的大脑,负责与前端交互,包括任务的提交、任务的分发、权限控制等,用户的一切操作都是由WebServer进行处理或者分发。

那么这里问题就来了,WebServer是不是会有单点问题?我的结论是确实会存在单点问题。

但很很多地方都没提azkaban的单点问题,我理解是基于几方面:

1、WebServer只是负责请求转发、定时触发,不责任重操作的任务执行,所以整体比较轻量,挂掉的风险比较低;

2、即使WebServer宕机,重启能够恢复任务,所以做好报警是可能一定程度及时发现的;

不管怎样,从技术的角度出发,单点问题还是很耗研发精力的,所以,结合单点问题,我后面会讲讲解决方案。

ExectorServer

ExectorServer是任务的实际执行的地方,任务用WebServer判断是否需要执行,然后分发给ExectorServer,由ExectorServer来负责具体的执行。

用户的处理逻辑就是在这里执行的。

ExectorServer内部其实就是一个线程池来执行这些任务,也比较简单,在后续的文章中会详细介绍。

Mysql

Mysql是整个系统的元数据存储地方,共涉及10+张表,后续会详细介绍这些表具体是做什么的。

除Mysql外,azkaban还提供h2作为内存数据库,便于调试

总结

Azkaban是一个比较不错的工作流调度平台,但它并不是完美的,在功能上,也有一些能够完善的地方。但对于一个开源平台来说,并不能苛求太多,我们可以基于azkaban系统来探索分布式调度平台的技术和发展,就是一件很不错的事情了

附录

azkaban官网:azkaban.github.io/

azkaban github地址:github.com/azkaban/azk...

azkaban快速入手:azkaban.readthedocs.io/en/latest

相关推荐
Andya_net4 小时前
Spring | @EventListener事件机制深度解析
java·后端·spring
无限大65 小时前
《AI观,观AI》:专栏总结+答疑|吃透核心,解决你用AI的所有困惑
前端·后端
小杍随笔5 小时前
【Rust 语言编程知识与应用:基础数据类型详解】
开发语言·后端·rust
毅航5 小时前
告别 AI 名词焦虑:一文读懂从 LLM 到 Agent Skill的演进
人工智能·后端
LucianaiB6 小时前
干货 | 手把手教你用 OpenClaw + Skill 实现微信公众号全自动创作发布
后端
eggwyw6 小时前
springboot和springframework版本依赖关系
java·spring boot·后端
韩立学长6 小时前
Springboot奶茶加盟信息管理系统m307m786(程序、源码、数据库、调试部署方案及开发环境)系统界面展示及获取方式置于文档末尾,可供参考。
数据库·spring boot·后端
开longlong了吗?7 小时前
Luan Takeaway——大模型驱动的智能外卖管理系统( Spring Cloud、Langchain4j )
后端·spring·spring cloud·langchain
品克缤7 小时前
Trading-Analysis:基于“规则+LLM”的行情分析终端(兼谈 Vibe Coding 实战感)
前端·后端·node.js·vue·express·ai编程·llama
开longlong了吗?8 小时前
Luan Takeaway System:基于Spring Boot + Spring Cloud的外卖业务系统
spring boot·后端·spring cloud