Python 全栈系列246 任务调度对象WFlaskAPS

说明

之前已经完全跑通了任务调度,实现了S2S的流转Python 全栈系列243 S2S flask_celery。由于request请求用起来比较别扭,所以创建一个对象来进行便捷操作。

内容

1 功能

WFlaskAPS包含管理定时任务的必要功能

python 复制代码
from datetime import datetime
from typing import List, Optional
from pydantic import BaseModel
import requests as req 

class WFlaskAPS(BaseModel):
    flask_aps_agent:str = 'IP:Port'

    # 获取当前的任务列表
    def get_jobs(self):
        url = 'http://%s/get_jobs' % self.flask_aps_agent
        return req.get(url).json()

    # 删除某个任务
    def remove_a_task(self, task_name = None):
        url = 'http://%s/remove_a_task/' % self.flask_aps_agent
        data_dict ={}
        data_dict['task_id'] = task_name
        return req.post(url, json=data_dict).json()

    # 获取任务状态
    def get_jobs_status(self):
        url = 'http://%s/get_jobs_status/' % self.flask_aps_agent
        return req.get(url).json()
    
    # 发布一个任务(task)
    # task_name 其实是job type
    # task_id 任务的唯一编号
    # task_type 原来的服务只实现了cron方式,因为cron方式可以实现其他两种方式。
    '''
    date:在指定的日期和时间运行一次
    interval:在指定时间间隔内运行
    cron:使用Cron表达式运行
    '''
    def publish_a_task(self,task_id= None ,task_name = None, task_type ='cron', task_kwargs = {},
                        year = None, month = None, day = None, week = None, day_of_week = None, 
                        hour = None,minute = None, second = None, start_date = None, end_date = None,
                        ):
        url = 'http://%s/publish_a_task/' % self.flask_aps_agent
        data_dict = {'task_id':task_id,
                     'task_name':task_name,
                     'task_type':task_type,
                     'task_kwargs':task_kwargs,
                     'year':year,
                     'month':month,
                     'day':day,
                     'week':week,
                     'day_of_week':day_of_week,
                     'hour':hour,
                     'minute':minute,
                     'second':second,
                     'start_date':start_date,
                     'end_date':end_date
                     }
        return req.post(url, json=data_dict).json()
        
    def pause_a_task(self, task_id = None):
        data_dict = {}
        url =  'http://%s/pause_a_task/' % self.flask_aps_agent
        data_dict['task_id'] = task_id
        
        return req.post(url, json=data_dict).json()

    def resume_a_task(self, task_id = None):
        data_dict = {}
        data_dict['task_id'] = task_id

        url =  'http://%s/resume_a_task/' % self.flask_aps_agent
        return req.post(url, json=data_dict).json()

    # task_name
    def add_a_job(self, fpath = None, func_name = None):
        
        url = 'http://%s/add_task_type/' % self.flask_aps_agent
        data = {}
        data['func_name'] = func_name
        with open(fpath, 'r') as f: 
            data['func_body'] = f.read()
        return req.post(url, json=data).json()

从逻辑上,首先需要创建任务类型(add_a_job),之后就可以依据这个job发布n个task,发布任务时的参数是最复杂的。原始的flask apscheduler其实提供了三种触发类型:

  • 1 date 一次性触发
  • 2 interval 周期触发
  • 3 cron 触发

由于cron触发可以涵盖前两种的变化,所以在之前的服务中,只创建了cron格式的定时任务。与linux系统里的cron不同,系统里最小的周期是分钟,而这里是秒。

默认情况下,周期任务是每秒执行的。如果需要改为n秒执行,可以用 '*/5'的方式,指定重复执行的周期。通过start_date和end_date可以钳制任务的周期跨度(所以当然也包含了一次性的任务)。

使用方法比直接请求接口简洁多了

python 复制代码
from Basefuncs import * 
# flask_aps_agent = 'IP:PORT'
wf = WFlaskAPS()

# 1 获取任务列表
wf.get_jobs()
# 2 删除一个任务
wf.remove_a_task('my_test1')
# 3 获取任务状态
wf.get_jobs_status()
# 4 发布一个任务
cur_dt_str = get_time_str1()
wf.publish_a_task(task_id ='my_test1', 
                  task_name= 'hello',
                  start_date=cur_dt_str,
                  second ='*/5')
# 5 暂停一个任务
wf.pause_a_task(task_id = 'my_test1')
# 6 恢复任务
wf.resume_a_task(task_id = 'my_test1')

# 7 增加一个job(task_name)
# wf.add_a_job()

2 Next

2.1 flask_aps_job_table

创建一张表,里面存储了job的元信息,表可以存在mymeta.flask_aps下面。

字段 解释
job_name job 名称
description 描述
para_dict 参数样例

2.2 flask_aps_task_table

字段 解释
machine 机器名, m1,m2
task_id 任务id
job_name 任务类型
set_to_status 被设定的状态
running_status 当前状态
start_dt 开始时间
end_dt 结束时间
interval_params 周期时间

机器名是重要的,因为同样的任务可能在不同的机器上执行。

2.3 assure_tasks.py

这个脚本伴随服务的启动会执行一次:

  • 1 根据本机名称,去flask_aps_task_table寻找哪些被设定为运行的任务
  • 2 获取当前的任务列表,根据任务名,运行状态的差集执行:
    • 1 发布任务。这种情况一般是服务重启之后,运行任务丢失了。

其他类型的操作,可以后续通过前端来交互(这里又会用一下MongoEngine).

2.4 S2S Work Mode

创建一个S2S,然后让Worker根据这个来执行一些任务。

相关推荐
残月只会敲键盘1 分钟前
面相小白的php反序列化漏洞原理剖析
开发语言·php
ac-er88883 分钟前
PHP弱类型安全问题
开发语言·安全·php
ac-er88884 分钟前
PHP网络爬虫常见的反爬策略
开发语言·爬虫·php
爱吃喵的鲤鱼14 分钟前
linux进程的状态之环境变量
linux·运维·服务器·开发语言·c++
DARLING Zero two♡40 分钟前
关于我、重生到500年前凭借C语言改变世界科技vlog.16——万字详解指针概念及技巧
c语言·开发语言·科技
Gu Gu Study42 分钟前
【用Java学习数据结构系列】泛型上界与通配符上界
java·开发语言
yyfhq44 分钟前
sdnet
python
测试19981 小时前
2024软件测试面试热点问题
自动化测试·软件测试·python·测试工具·面试·职场和发展·压力测试
love_and_hope1 小时前
Pytorch学习--神经网络--搭建小实战(手撕CIFAR 10 model structure)和 Sequential 的使用
人工智能·pytorch·python·深度学习·学习
芊寻(嵌入式)1 小时前
C转C++学习笔记--基础知识摘录总结
开发语言·c++·笔记·学习