说明
之前已经完全跑通了任务调度,实现了S2S的流转Python 全栈系列243 S2S flask_celery。由于request请求用起来比较别扭,所以创建一个对象来进行便捷操作。
内容
1 功能
WFlaskAPS包含管理定时任务的必要功能
python
from datetime import datetime
from typing import List, Optional
from pydantic import BaseModel
import requests as req
class WFlaskAPS(BaseModel):
flask_aps_agent:str = 'IP:Port'
# 获取当前的任务列表
def get_jobs(self):
url = 'http://%s/get_jobs' % self.flask_aps_agent
return req.get(url).json()
# 删除某个任务
def remove_a_task(self, task_name = None):
url = 'http://%s/remove_a_task/' % self.flask_aps_agent
data_dict ={}
data_dict['task_id'] = task_name
return req.post(url, json=data_dict).json()
# 获取任务状态
def get_jobs_status(self):
url = 'http://%s/get_jobs_status/' % self.flask_aps_agent
return req.get(url).json()
# 发布一个任务(task)
# task_name 其实是job type
# task_id 任务的唯一编号
# task_type 原来的服务只实现了cron方式,因为cron方式可以实现其他两种方式。
'''
date:在指定的日期和时间运行一次
interval:在指定时间间隔内运行
cron:使用Cron表达式运行
'''
def publish_a_task(self,task_id= None ,task_name = None, task_type ='cron', task_kwargs = {},
year = None, month = None, day = None, week = None, day_of_week = None,
hour = None,minute = None, second = None, start_date = None, end_date = None,
):
url = 'http://%s/publish_a_task/' % self.flask_aps_agent
data_dict = {'task_id':task_id,
'task_name':task_name,
'task_type':task_type,
'task_kwargs':task_kwargs,
'year':year,
'month':month,
'day':day,
'week':week,
'day_of_week':day_of_week,
'hour':hour,
'minute':minute,
'second':second,
'start_date':start_date,
'end_date':end_date
}
return req.post(url, json=data_dict).json()
def pause_a_task(self, task_id = None):
data_dict = {}
url = 'http://%s/pause_a_task/' % self.flask_aps_agent
data_dict['task_id'] = task_id
return req.post(url, json=data_dict).json()
def resume_a_task(self, task_id = None):
data_dict = {}
data_dict['task_id'] = task_id
url = 'http://%s/resume_a_task/' % self.flask_aps_agent
return req.post(url, json=data_dict).json()
# task_name
def add_a_job(self, fpath = None, func_name = None):
url = 'http://%s/add_task_type/' % self.flask_aps_agent
data = {}
data['func_name'] = func_name
with open(fpath, 'r') as f:
data['func_body'] = f.read()
return req.post(url, json=data).json()
从逻辑上,首先需要创建任务类型(add_a_job
),之后就可以依据这个job发布n个task,发布任务时的参数是最复杂的。原始的flask apscheduler其实提供了三种触发类型:
- 1 date 一次性触发
- 2 interval 周期触发
- 3 cron 触发
由于cron触发可以涵盖前两种的变化,所以在之前的服务中,只创建了cron格式的定时任务。与linux系统里的cron不同,系统里最小的周期是分钟,而这里是秒。
默认情况下,周期任务是每秒执行的。如果需要改为n秒执行,可以用 '*/5'的方式,指定重复执行的周期。通过start_date和end_date可以钳制任务的周期跨度(所以当然也包含了一次性的任务)。
使用方法比直接请求接口简洁多了
python
from Basefuncs import *
# flask_aps_agent = 'IP:PORT'
wf = WFlaskAPS()
# 1 获取任务列表
wf.get_jobs()
# 2 删除一个任务
wf.remove_a_task('my_test1')
# 3 获取任务状态
wf.get_jobs_status()
# 4 发布一个任务
cur_dt_str = get_time_str1()
wf.publish_a_task(task_id ='my_test1',
task_name= 'hello',
start_date=cur_dt_str,
second ='*/5')
# 5 暂停一个任务
wf.pause_a_task(task_id = 'my_test1')
# 6 恢复任务
wf.resume_a_task(task_id = 'my_test1')
# 7 增加一个job(task_name)
# wf.add_a_job()
2 Next
2.1 flask_aps_job_table
创建一张表,里面存储了job的元信息,表可以存在mymeta.flask_aps下面。
字段 | 解释 |
---|---|
job_name | job 名称 |
description | 描述 |
para_dict | 参数样例 |
2.2 flask_aps_task_table
字段 | 解释 |
---|---|
machine | 机器名, m1,m2 |
task_id | 任务id |
job_name | 任务类型 |
set_to_status | 被设定的状态 |
running_status | 当前状态 |
start_dt | 开始时间 |
end_dt | 结束时间 |
interval_params | 周期时间 |
机器名是重要的,因为同样的任务可能在不同的机器上执行。
2.3 assure_tasks.py
这个脚本伴随服务的启动会执行一次:
- 1 根据本机名称,去flask_aps_task_table寻找哪些被设定为运行的任务
- 2 获取当前的任务列表,根据任务名,运行状态的差集执行:
- 1 发布任务。这种情况一般是服务重启之后,运行任务丢失了。
其他类型的操作,可以后续通过前端来交互(这里又会用一下MongoEngine).
2.4 S2S Work Mode
创建一个S2S,然后让Worker根据这个来执行一些任务。