最近项目需要使用定时任务,而使用了PowerJob做任务调度模块,感觉这个框架真香,今天我们就来深入了解一下新一代的定时任务框架------PowerJob!
简介
-
PowerJob是基于java开发的企业级的分布式任务调度平台,与xxl-job一样,基于web页面实现任务调度配置与记录,使用简单,上手快速,其主要功能特性如下:
-
使用简单:提供前端Web界面,允许开发者可视化地完成调度任务的管理(增、删、改、查)、任务运行状态监控和运行日志查看等功能。
-
定时策略完善:支持 CRON 表达式、固定频率、固定延迟和API四种定时调度策略。
-
执行模式丰富:支持单机、广播、Map、MapReduce 四种执行模式,其中 Map/MapReduce 处理器能使开发者寥寥数行代码便获得集群分布式计算的能力。
-
工作流支持:支持在线配置任务依赖关系(DAG),以可视化的方式对任务进行编排,同时还支持上下游任务间的数据传递,以及多种节点类型(判断节点 & 嵌套工作流节点)。
-
执行器支持广泛:支持 Spring Bean、内置/外置 Java 类,另外可以通过引入官方提供的依赖包,一键集成 Shell、Python、HTTP、SQL 等处理器,应用范围广。
-
运维便捷:支持在线日志功能,执行器产生的日志可以在前端控制台页面实时显示,降低 debug 成本,极大地提高开发效率。
-
依赖精简:最小仅依赖关系型数据库(MySQL/PostgreSQL/Oracle/MS SQLServer...)
-
高可用 & 高性能:调度服务器经过精心设计,一改其他调度框架基于数据库锁的策略,实现了无锁化调度。部署多个调度服务器可以同时实现高可用和性能的提升(支持无限的水平扩展)。
-
故障转移与恢复:任务执行失败后,可根据配置的重试策略完成重试,只要执行器集群有足够的计算节点,任务就能顺利完成。
定时任务类型
-
与传统的定时任务框架对比,powerJob支持更多的定时任务类型:
API: 通过客户端提供的api接口触发,服务端不会主动调度,适用于与业务服务上下连接或只调度一次的业务场景
-
CRON: 通过cron表达式调度,这是多数定时任务框架都支持的
-
固定频率:每隔多少毫秒执行一次。
-
固定延迟:延迟多少毫秒执行一次
-
工作流:配合工作流进行调度,服务端不会主动调度,当工作流节点执行到该任务时运行。
运行
- 然后将powerjob-server/powerjob-server-starter下的application-daily.properties配置文件中的数据库配置改成你服务器的
其中daily,pre,product 表示日常、预生产、生产环境下的配置,与我们常见的dev, test, prod类似,可以根据需要进行调整
- 我们先来本地运行启动类PowerJobServerApplication一下试试,启动成功后,访问http://localhost:7700,出现登陆页则说明运行成功
3、先注册一个执行器,注意这里的应用名称不能顺便取,下文在客户端的配置的app-name要与该名称保持一致
4、然后用该执行器名和密码登录
5、如下,我们就登录成功了
部署 以 jar 包的形式运行
- maven 打jar 包
注意,如果这里报错
那么可以将maven的健康检查关闭,点击如图所示按钮,并且看到test置灰,则表示关闭
新版idea 可能这样的
- 执行mvn package打包项目
- 在powerjob-server-starter的target目录下即可看到打包出来的jar,将其上传到指定服务器,通过java -jar指令即可运行
创建新项目
1、创建一个springboot项目,用于定时任务客户端,引入客户端依赖,如果是spring或其他java项目引入,可参考官网文档:
xml
<dependency>
<groupId>tech.powerjob</groupId>
<artifactId>powerjob-worker-spring-boot-starter</artifactId>
<version>4.3.2</version>
</dependency>
2、修改配置文件
yml
powerjob:
worker:
enabled: true
enable-test-mode: false
port: 27777
app-name: admin # 应用名称,需与PowerJob服务 注册的应用保持一致
server-address: 127.0.0.1:7700
protocol: http
max-result-length: 4096
max-lightweight-task-num: 1024
max-heavy-task-num: 64
3、启动类上添加注解@EnableScheduling
4、通过申明BasicProcessor接口,实现process方法来书写一个简单的定时任务示例类,注意要声明为bean
5、启动客户端项目,运行成功后,可以在服务端首页看到机器实例
6、服务端任务管理点击新建任务
其中处理器配置是通过书写处理器的全类路径名来声明的,比如我这里是com.example.powerjobdemo.job.SimpleJobServer
7、创建成功后,可以在列表看到新建的任务
8、打开客户端控制台,也能看到输出的参数和执行打印,说明任务执行成功
9、同时我们可以在运行记录中看到执行日志
至此,针对powerjob的最简单使用就完成了
定时信息:
主要选择定时任务类型,支持API, CRON,固定频率、固定延迟、工作流、每日固定间隔等几种定时任务类型。
生命周期:
这是比其他任务框架更便捷的功能,指定了任务的生效周期,如果该任务是预定某时间段内执行的,可以通过该参数配置
执行配置:
-
执行类型支持单机执行、广播执行、Map执行、MapReduce执行
-
单机执行表示只需要有一个节点执行任务即可的场景
-
广播执行表示需要全部节点一同执行的场景,比如清除机器日志、各节点数据统计
-
Map与MapReduce执行都是表示分布式、分批执行,用来拆分计算量、耗时较大的任务,区别在于Map执行是一种简单的数据处理逻辑,特点是将输入数据拆分成多个子块,并交给多个分布式节点同时执行,以提高数据处理效率,适用于简单的数据处理场景
-
MapReduce执行是一种大数据处理框架,处理逻辑是将复杂的数据处理拆分成Map和Reduce阶段进行处理,通过数据分组计算后合并来提供数据处理效率,更适合复杂的大数据场景
运行时配置:
-
支持HEALTH_FIRST和RANDOM,即第一个健康节点和随机,用于选择执行处理器节点的策略。
-
最大实例数用于控制处理器节点数量,线程并发度用于控制并发,运行时间限制