前言
遵循flask框架的标准的库,称为flask扩展,flask_apscheduler模块就是一个flask扩展,它使用了flask编程上下文,同时内部完全依赖apscheduler。
我近期使用flask_apscheduler遇到了一个所有job全部死亡的bug。现象:job平时是正常启动的,突然某个时刻全部挂了,所以需要分析一遍源码,找出解决方案,同时也能提高自己的代码阅读能力,大家一起学习进步
flask_apscheduler环境介绍
官方文档:https://viniciuschiele.github.io/flask-apscheduler/
当前分析版本:1.12.4
安装方式:pip install Flask-APScheduler
源码位置:site-packages目录下,第三方模块一般都在这个目录下,尤其是pip安装的......
包结构介绍
flask_apscheduler是个包模块,包括__init__.py,共计6个模块
代码加载顺序
from flask_apscheduler import APScheduler
一般情况下,我们会在flask程序中,写下如上一行,此时flask_apscheduler的__init__.py中没有缩进的代码会立即执行,这也是python中__init__.py模块的加载标准,不熟悉的同学,可以去温习以下。
init.py模块分析
from apscheduler.schedulers.base import STATE_PAUSED, STATE_RUNNING, STATE_STOPPED
from .scheduler import APScheduler
这个包模块文件__init__.py代码量不大,只有2行代码(不算注释)
主要做了两件事
1、从标准库apscheduler下的base模块中,导入几个全局变量:STATE_PAUSED............
2、从当前包下的scheduler模块中导入APScheduler类
标准库apscheduler的我就先不分析,先集中在自己写的这个scheduler模块,由于这里有import的操作,此时scheduler模块开始加载到内存中,我们接下来看看scheduler模块的分析......
scheduler模块分析
主要分析的是flask_apscheduler包模块下的scheduler.py模块,上图红色箭头所指
看了下这个scheduler.py模块共计400多行,我们当然不会逐行去分析了,而是以一个一个整体的方式去分析大佬的代码,这才是分析源码的正路,细枝末节再用的时候再去看即可。。
scheduler分析过程一:模块导入
import flask import functools import logging import socket import warnings import werkzeug from apscheduler.events import EVENT_ALL from apscheduler.schedulers.background import BackgroundScheduler from apscheduler.jobstores.base import JobLookupError from flask import make_response from . import api from .utils import fix_job_def, pop_trigger
总体的导入分3部分
1、标准库的导入
functools、logging、socket、warnings、apscheduler(重点依赖这个标准库)
2、第三方库
flask、werkzeug
3、自己写的模块
api、utils
整体说明:作者同时使用了标准库、比如logging用于日志打印的标准库,还有地方依赖库,当然是flask和werkzeug(flask依赖的底层网络库)、还有自己写的两个模块,api和utils。。
最最最重要的apscheduler的使用,尤其是导入BackgroundScheduler这个类
scheduler分析过程二:创建日志分析对象
LOGGER = logging.getLogger('flask_apscheduler')
scheduler分析过程三:创建APScheduler类
class APScheduler(object):
............省略............
这个APScheduler创建的对象,是以后我们经常用的对象,作为整个模块的业务逻辑入口,后续单独开篇文章介绍这个类的封装。
初步总结
scheduler就干了3件事、导入模块、创建日志分析对象、创建APScheduler类。
继续分析当前包模块
上面已经分析了__init__.py模块、还有scheduler.py模块,还记得scheduler.py下面这两句代码吗?
from . import api
from .utils import fix_job_def, pop_trigger
我们将继续分析api模块和utils模块,因为这俩模块先后加载到内存中了
api模块分析
scheduler.py模块加载的时候,导入了api.py模块,此时api.py模块没有缩进代码将会被执行
api模块分析过程一:模块导入
import logging from apscheduler.jobstores.base import ConflictingIdError, JobLookupError from collections import OrderedDict from flask import current_app, request, Response from .json import jsonify
过程也是3部分
1、导入标准库(导入过的不会重复导入,所以这里写了也没事,内存中是同一个模块对象)
logging、apscheduler、collections模块
2、导入第三方库
flask
3、导入自己写的模块
json
api模块分析过程二:创建函数
1、连续创建了9个函数对象
2、且他们都与flask应用对象有所关联,我给找其中一个函数给大伙看看
def add_job(): """Adds a new job.""" data = request.get_json(force=True) try: job = current_app.apscheduler.add_job(**data) return jsonify(job) except ConflictingIdError: logging.warning(f'Job {data.get("id")} already exists.') return jsonify(dict(error_message='Job %s already exists.' % data.get('id')), status=409) except Exception as e: logging.error(e, exc_info=True) return jsonify(dict(error_message=str(e)), status=500)
add_job,通过找个函数我们随时向调度器中添加一个job,可以说是一种动态添加job的方式!!
current_app 表示当前flask对象
current.apscheduler表示与之关联的Scheduler对象
return jsonify(job) 最终竟然也返回了一个响应,这是为啥呢?原来是flask_apscheduler给我们留的后门!!
在Scheduler类中,有个方法,是在框架中唯一使用这些api模块中的函数的地方
开关在这里,原来我们可以通过SCHEDULER_API_ENABLED,这样的flask配置修改是否开启快捷开关,这里不看源码,是肯定不知道有这个后门的,看来我也要开启了
初步总结
api模块中的函数,可以在当前flask应用注册路由,那样我们通过http请求,就能操作job了,非常的方便debug呀,爽..
utils模块分析
这个模块,看名字就知道是工具模块了,我们看看这个模块加载的时候干了什么
utils.py模块分析过程一:模块导入
import dateutil.parser import six from apscheduler.triggers.cron import CronTrigger from apscheduler.triggers.date import DateTrigger from apscheduler.triggers.interval import IntervalTrigger from collections import OrderedDict
1、标准库
collections
apscheduler
2、第三方库
dateutil
six
utils.py模块分析过程二:创建几个函数
作者真是代码写的干净利索啊,牛逼,这几个函数要工具相关,比如job转为字典,看来是来兜底用的模块,厉害,抽空看看几个函数具体是干啥的
json模块分析
json模块分析过程一:模块导入
from __future__ import absolute_import import datetime import flask from apscheduler.job import Job from .utils import job_to_dict import json # noqa
1、标准库
future
datetime
apscheduler
json
2、 三方库
flask
看来这个模块主要是操作json格式的
json模块分析过程二:创建全局变量
loads = json.loads
拿来注意体现的好啊,创建一个loads全局变量,指向的是json模块下的loads函数,这样以后用这个函数就轻松了......
json模块分析过程三:创建函数
创建的dumps函数和jsonify函数
json模块分析过程四:创建类
class JSONEncoder(json.JSONEncoder): def default(self, obj): if isinstance(obj, datetime.datetime): return obj.isoformat() if isinstance(obj, Job): return job_to_dict(obj) return super(JSONEncoder, self).default(obj)
创建了一个用于编解码json的类
剩下的auth.py模块分析
剩下一个auth.py模块,我没找到该模块加载的位置,不知道在哪用的。。。。
总结
1、flask_apschduler依赖标准库apschduler、只不过做了一个与flask对象上下文的结合
2、比如可以通过flask的路径,直接创建job、删除job、甚至查看job状态(但是感觉不安全啊)
3、可以继续深入到模块中的Scheduler类中继续分析,可以看到job是有挂掉的可能的。
4、看源码收获每次都是满满的,爽。。。