✨Quartz✨触发Trigger及状态转换✨


前言

分布式定时任务框架Quartz 的定时任务依赖触发器Trigger 来触发执行,那么Trigger 如何被触发,在整个触发流程中,Trigger的状态如何变化,本文将对这部分内容进行详细分析。

Quartz 框架的基本概念和基本使用可以参考翻翻Quartz框架的旧账

本文基于Quartz2.3.2版本展开分析。

正文

先回顾一下QuartzSchedulerThread 的作用,其是由QuartzScheduler 持有的 调度线程 ,在QuartzScheduler 创建出来并被调用start() 方法后,QuartzSchedulerThread 就会开始运行,会不断的去判断哪些Trigger 到点需要触发了,需要触发的Trigger 就会被从ThreadPool 中分配一个线程,然后执行Trigger 关联的JobDetail

具体的整套逻辑,全部在QuartzSchedulerThreadrun() 方法中,下面一起来看一下。

下面方法比较长,分支也比较多,所以重点看有注释的部分,再结合后面的补充说明进行理解

java 复制代码
@Override
public void run() {
    int acquiresFailed = 0;

    while (!halted.get()) {
        try {
            synchronized (sigLock) {
                while (paused && !halted.get()) {
                    try {
                        sigLock.wait(1000L);
                    } catch (InterruptedException ignore) {

                    }
                    acquiresFailed = 0;
                }

                if (halted.get()) {
                    break;
                }
            }

            if (acquiresFailed > 1) {
                try {
                    long delay = computeDelayForRepeatedErrors(qsRsrcs.getJobStore(), acquiresFailed);
                    Thread.sleep(delay);
                } catch (Exception ignore) {

                }
            }

            // 从ThreadPool中获取当前可用线程数量
            // 若没有可用线程则阻塞直到有可用线程
            int availThreadCount = qsRsrcs.getThreadPool().blockForAvailableThreads();
            if(availThreadCount > 0) {

                List<OperableTrigger> triggers;

                long now = System.currentTimeMillis();

                clearSignaledSchedulingChange();
                try {
                    // 获取下一次触发时间在30分钟内的Trigger
                    // 这里的步骤可以分解如下
                    // 1. 从qrtz_locks表获取TRIGGER_ACCESS锁
                    // 2. 从qrtz_triggers表获取触发时间在30分钟内且状态是WAITING的Trigger
                    // 3. 遍历每一个步骤2拿到的Trigger
                    // 4. 从qrtz_job_details表查询出Trigger对应的JobDetail
                    // 5. 如果JobDetail不允许并发执行则判断一下当前JobDetail是否已经由另外一个Tragger执行
                    //    若已经由另外一个Trigger执行则当前Trigger本次不执行
                    // 6. 将确定要执行的Trigger在qrtz_triggers表中的状态设置为ACQUIRED
                    // 7. 将确定要执行的Trigger插入qrtz_fired_triggers表且状态为ACQUIRED
                    // 8. 继续遍历步骤2拿到的Trigger直至全部遍历完
                    // 9. 释放TRIGGER_ACCESS锁
                    // 10. 返回所有符合条件的Trigger
                    triggers = qsRsrcs.getJobStore().acquireNextTriggers(
                            now + idleWaitTime, Math.min(availThreadCount, qsRsrcs.getMaxBatchSize()), qsRsrcs.getBatchTimeWindow());
                    acquiresFailed = 0;
                    if (log.isDebugEnabled())
                        log.debug("batch acquisition of " + (triggers == null ? 0 : triggers.size()) + " triggers");
                } catch (JobPersistenceException jpe) {
                    if (acquiresFailed == 0) {
                        qs.notifySchedulerListenersError(
                            "An error occurred while scanning for the next triggers to fire.",
                            jpe);
                    }
                    if (acquiresFailed < Integer.MAX_VALUE)
                        acquiresFailed++;
                    continue;
                } catch (RuntimeException e) {
                    if (acquiresFailed == 0) {
                        getLog().error("quartzSchedulerThreadLoop: RuntimeException "
                                +e.getMessage(), e);
                    }
                    if (acquiresFailed < Integer.MAX_VALUE)
                        acquiresFailed++;
                    continue;
                }

                if (triggers != null && !triggers.isEmpty()) {

                    now = System.currentTimeMillis();
                    long triggerTime = triggers.get(0).getNextFireTime().getTime();
                    long timeUntilTrigger = triggerTime - now;
                    // 所有Trigger中最先会触发的Trigger的触发时间如果距离当前大于2ms则等待
                    // 直到最先会触发的Trigger的触发时间距离当前小于2ms
                    while(timeUntilTrigger > 2) {
                        synchronized (sigLock) {
                            if (halted.get()) {
                                break;
                            }
                            if (!isCandidateNewTimeEarlierWithinReason(triggerTime, false)) {
                                try {
                                    now = System.currentTimeMillis();
                                    timeUntilTrigger = triggerTime - now;
                                    if(timeUntilTrigger >= 1)
                                        sigLock.wait(timeUntilTrigger);
                                } catch (InterruptedException ignore) {
                                }
                            }
                        }
                        if(releaseIfScheduleChangedSignificantly(triggers, triggerTime)) {
                            break;
                        }
                        now = System.currentTimeMillis();
                        timeUntilTrigger = triggerTime - now;
                    }

                    if(triggers.isEmpty())
                        continue;

                    List<TriggerFiredResult> bndles = new ArrayList<TriggerFiredResult>();

                    boolean goAhead = true;
                    synchronized(sigLock) {
                        goAhead = !halted.get();
                    }
                    if(goAhead) {
                        try {
                            // 将Trigger进行fire
                            // 但是这里并不会执行对应的任务逻辑
                            // 对应的步骤可以分解如下
                            // 1. 从qrtz_locks表获取TRIGGER_ACCESS锁
                            // 2. 遍历每一个需要执行的Trigger
                            // 3. 将qrtz_fired_triggers表中需要执行的Trigger的状态设置为EXECUTING
                            // 4. 将Trigger对象的下一次执行时间nextFireTime更新
                            // 5. 如果Trigger执行的JobDetail不允许并发执行
                            //    将Trigger对象的状态更新为BLOCKED
                            //    否则将Trigger对象的状态更新为WAITING
                            // 6. 如果Trigger执行的JobDetail不允许并发执行
                            //    将JobDetail关联的其它Trigger在qrtz_triggers表里的状态更新
                            //    如果是WAITING或ACQUIRED则更新为BLOCKED
                            // 7. 如果Trigger是最后一次执行则将Trigger对象的状态更新为COMPLETE
                            // 8. 将Trigger对象更新回qrtz_triggers表
                            // 9. 基于这个Trigger创建一个TriggerFiredResult并添加到集合
                            // 10. 继续遍历下一个需要执行的Trigger直至遍历完毕
                            // 11. 释放TRIGGER_ACCESS锁
                            // 12. 此时得到了所有执行的Trigger对应的TriggerFiredResult的集合
                            // 上面步骤执行完后所有fire的Trigger在qrtz_fired_triggers表中的状态是EXECUTING
                            // 在qrtz_triggers表中的状态可能是WAITING,BLOCKED或COMPLETE
                            // 但是此时Trigger对应的JobDetail实际是还没有被执行的
                            List<TriggerFiredResult> res = qsRsrcs.getJobStore().triggersFired(triggers);
                            if(res != null)
                                bndles = res;
                        } catch (SchedulerException se) {
                            qs.notifySchedulerListenersError(
                                    "An error occurred while firing triggers '"
                                            + triggers + "'", se);
                            for (int i = 0; i < triggers.size(); i++) {
                                qsRsrcs.getJobStore().releaseAcquiredTrigger(triggers.get(i));
                            }
                            continue;
                        }

                    }

                    // 遍历每一个执行的Trigger对应的TriggerFiredResult
                    for (int i = 0; i < bndles.size(); i++) {
                        TriggerFiredResult result =  bndles.get(i);
                        TriggerFiredBundle bndle =  result.getTriggerFiredBundle();
                        Exception exception = result.getException();

                        if (exception instanceof RuntimeException) {
                            getLog().error("RuntimeException while firing trigger " + triggers.get(i), exception);
                            qsRsrcs.getJobStore().releaseAcquiredTrigger(triggers.get(i));
                            continue;
                        }

                        if (bndle == null) {
                            qsRsrcs.getJobStore().releaseAcquiredTrigger(triggers.get(i));
                            continue;
                        }

                        JobRunShell shell = null;
                        try {
                            // 基于TriggerFiredResult创建JobRunShell
                            shell = qsRsrcs.getJobRunShellFactory().createJobRunShell(bndle);
                            shell.initialize(qs);
                        } catch (SchedulerException se) {
                            qsRsrcs.getJobStore().triggeredJobComplete(triggers.get(i), bndle.getJobDetail(), CompletedExecutionInstruction.SET_ALL_JOB_TRIGGERS_ERROR);
                            continue;
                        }

                        // 在ThreadPool中分配一个线程来执行JobRunShell
                        // 随后就会在JobRunShell的run()方法中执行JobDetail
                        // 执行完毕后会再执行Trigger的完成逻辑
                        // 对应的步骤可以拆分如下
                        // 1. 从qrtz_locks表获取TRIGGER_ACCESS锁
                        // 2. 如果Trigger后续不再执行则在qrtz_triggers表里删除这个Trigger
                        // 3. 如果Trigger执行的任务是不允许并发执行则将所有关联的Trigger状态做如下更新
                        //    将Trigger状态由BLOCKED恢复成WAITING
                        // 4. 如果任务类由@PersistJobDataAfterExecution注解修饰则
                        //    将qrtz_job_details表里的JobDetail的JOB_DATA字段更新
                        // 5. 删除Trigger在qrtz_fired_triggers表中对应的记录
                        if (qsRsrcs.getThreadPool().runInThread(shell) == false) {
                            getLog().error("ThreadPool.runInThread() return false!");
                            qsRsrcs.getJobStore().triggeredJobComplete(triggers.get(i), bndle.getJobDetail(), CompletedExecutionInstruction.SET_ALL_JOB_TRIGGERS_ERROR);
                        }

                    }

                    continue;
                }
            } else {
                continue;
            }

            long now = System.currentTimeMillis();
            long waitTime = now + getRandomizedIdleWaitTime();
            long timeUntilContinue = waitTime - now;
            synchronized(sigLock) {
                try {
                    if(!halted.get()) {
                    if (!isScheduleChanged()) {
                        sigLock.wait(timeUntilContinue);
                    }
                    }
                } catch (InterruptedException ignore) {
                }
            }

        } catch(RuntimeException re) {
            getLog().error("Runtime error occurred in main trigger firing loop.", re);
        }
    }
    qs = null;
    qsRsrcs = null;
}

下面分小节进行讲解

1. 拿到即将触发的所有Trigger

这里的即将触发,就是触发时间在30分钟内且状态是 WAITING Trigger

针对每一个即将触发的Trigger ,其在qrtz_triggers 表里的状态此时会被置为ACQUIRED ,针对这个Trigger 同时也会插入一条记录到qrtz_fired_triggers 表中,状态也是ACQUIRED ,表示这个Trigger 已经在fire处理了。

假如我们有一个trigger-1 ,对应任务允许并发执行,还有一个trigger-2 ,对应任务不允许并发执行( @DisallowConcurrentExecution 注解修饰 ),并且这两个Trigger 的触发时间均在30分钟内。

那么此时在qrtz_triggers表中,它们的状态是这样的。

TRIGGER_NAME ... TRIGGER_STATE
trigger-1 ... ACQUIRED
trigger-2 ... ACQUIRED

qrtz_fired_triggers表中,它们的状态是这样的。

TRIGGER_NAME ... STATE
trigger-1 ... ACQUIRED
trigger-2 ... ACQUIRED

2. 等待最先触发的 Trigger的触发时间在 2ms

如果最先触发的Trigger 的触发时间距离当前大于2ms ,则进行等待,直到小于等于2ms

3. Trigger进行fire

fire 一个Trigger 其实就是将这个Triggerqrtz_fired_triggers 表中记录的状态设置为EXECUTING ,后面会为这个Trigger 分配线程来执行任务,注意此时 Trigger 对应的任务实际上是还没有执行的

Triggerfire 之后,这个Triggerqrtz_triggers 里面的状态 及下一次fire 的时间会被更新,这里需要关注一下 状态 的更新。

如果Trigger 对应的任务没有被@DisallowConcurrentExecution 注解修饰,那么这个Trigger状态 更新为WAITING ;如果Trigger 对应的任务被@DisallowConcurrentExecution 注解修饰,那么这个Trigger状态 会更新为BLOCKED ,并且还会将这个被@DisallowConcurrentExecution 注解修饰的任务所有关联的Trigger 的状态更新为BLOCKED

注意到一个Trigger 会被fire ,首先就是需要满足触发时间在 30 分钟内且状态是 WAITING ,所以如果一个被@DisallowConcurrentExecution 注解修饰的任务正在被执行,那么这个任务关联的所有Trigger 的状态都应该被置为BLOCKED ,以防止这些Trigger 再次被fire

回到第1 小节中的例子,此时在qrtz_triggers 表中,trigger-1trigger-2它们的状态是这样的。

TRIGGER_NAME ... TRIGGER_STATE
trigger-1 ... WAITING
trigger-2 ... BLOCKED

qrtz_fired_triggers表中,它们的状态是这样的。

TRIGGER_NAME ... STATE
trigger-1 ... EXECUTING
trigger-2 ... EXECUTING

4. fire Trigger分配线程并执行任务

fireTrigger 会在qrtz_fired_triggers 表中插入一条记录,随后就会被分配一个线程来执行这个Trigger 关联的JobDetail

执行JobDetail 没什么好说的,就是调用到这个任务的execute() 方法,我们这里需要关注的是任务执行完毕后的对于Triggercomplete逻辑。

首先 会判断当前这个Trigger 是不是不会再执行了,如果不会再执行了,那么就会在qrtz_triggers 表里删除这个Trigger

然后 就是如果这个Trigger 执行的任务是不允许并发执行的,那么此时这个任务关联的所有Trigger 的状态肯定都是BLOCKED ,所以还需要将这些Trigger 的状态由BLOCKED 还原为WAITING

最后就是删除fireTriggerqrtz_fired_triggers表中的记录。

回到第1 小节中的例子,此时在qrtz_triggers 表中,trigger-1trigger-2它们的状态是这样的。

TRIGGER_NAME ... TRIGGER_STATE
trigger-1 ... WAITING
trigger-2 ... WAITING

qrtz_fired_triggers表中,它们都没有记录了。

5. 暂停一个Trigger

在上面的所有讨论中,都没有提及Trigger暂停 状态,也就是PAUSED状态,因为这个状态相对独立,没必要和上面的其余状态转换混在一起讨论。

我们可以通过如下手段将Trigger 的状态置为PAUSED

  1. 通过Triggergroupname 找到Trigger ,然后将其状态置为PAUSED 。这种可以理解为暂停一个Trigger
  2. 通过JobDetail 找到所有关联的Trigger ,然后将这些Trigger 的状态置为PAUSED 。这种可以理解为暂停一个JobDetail

Triggerqrtz_triggers 表中的状态是PAUSED 之后,就不再满足触发时间在 30 分钟内且状态是 WAITING ,从而Trigger 就不会被fire,对应的任务也不会被执行。

总结

阅读完本文后,应该能够回答下面的问题。

1. Trigger的触发流程是怎么样的

首先触发时间在30 分钟内且状态是WAITINGTrigger会被获取出来;

其次最先触发的Trigger 的触发时间在2s 内时就会开始fire 这些Trigger

fire 一个Trigger 就是将这个Trigger 插入一条数据到qrtz_fired_triggers 表,然后会为这个Trigger 对应的任务分配一个线程来执行,执行完毕后删除Triggerqrtz_fired_triggers表里的记录。

2. Trigger的状态是怎么变化的

Trigger 不触发时状态是WAITING,表示等待着被触发并且允许被触发;

Trigger 触发时间在30 分钟内时会被获取出来等待被fire ,此时Trigger 状态是ACQUIRED,表示已经被获取;

Triggerfire 后,如果Trigger 关联的任务允许并发执行,此时Trigger 状态还原为WAITING ,表示等待着下一次触发,如果Trigger 关联的任务不允许并发执行,此时这个任务关联的所有Trigger 的状态会被设置为BLOCKED ,表示这些Trigger都阻塞住了;

Trigger 对应的任务被执行完毕后,如果Trigger 后续不会再触发了,则删除Trigger ,如果执行的任务是不允许并发执行的,则需要将这个任务关联的所有Trigger 的状态从BLOCKED 还原为WAITING

3. Trigger如何暂停

我们可以通过暂停JobDetail 来暂停其关联的所有Trigger ,也可以单独暂停某一个Trigger

所谓暂停Trigger ,其实就是将这个Trigger 的状态设置为PAUSED ,一旦设置为PAUSED ,这些Trigger 就不满足触发时间在 30 分钟内且状态是 WAITING,从而就不会被触发了。

4. Quartz如何保证同时只有一个实例执行定时任务

Quartz 基于数据库实现了一套分布式锁 ,可以理解为抢占到锁的实例才有资格来触发Trigger从而执行定时任务。


总结不易,如果本文对你有帮助,烦请点赞,收藏加关注,谢谢帅气漂亮的你。

相关推荐
Code季风6 分钟前
微服务分布式配置中心:Gin Web 服务层与 gRPC 服务层集成 Nacos 实战
分布式·微服务·rpc·架构·go·gin·consul
德育处主任17 分钟前
在亚马逊云上,如何基于 VPC IPAM 的 ALB 公网 IP 预测分配?
后端
喜欢吃豆26 分钟前
深入企业内部的MCP知识(三):FastMCP工具转换(Tool Transformation)全解析:从适配到增强的工具进化指南
java·前端·人工智能·大模型·github·mcp
不吃肉的羊28 分钟前
PHP设置文件上传最大值
后端·php
用户15517339388330 分钟前
前后端处理 `multipart/form-data` 混合参数(实体对象+文件)方案
java
专注物联网全栈开发31 分钟前
ESP32的IRAM用完了怎么优化
后端
雨落倾城夏未凉32 分钟前
7.QObject定时器和QTimer定时器的区别
后端·qt
东阳马生架构34 分钟前
订单初版—3.支付和履约链路中的技术问题说明文档
java
洗澡水加冰34 分钟前
RAG系统工程化
后端·aigc
paopaokaka_luck1 小时前
智能推荐社交分享小程序(websocket即时通讯、协同过滤算法、时间衰减因子模型、热度得分算法)
数据库·vue.js·spring boot·后端·websocket·小程序