PostgreSQL技术内幕24：定时任务调度插件pg_cron

文章目录

- 0.简介
- 1.基础知识
- 2.pg_cron安装使用方式
- - [2.1 安装pg_cron](#2.1 安装pg_cron)
  - [2.2 使用方式](#2.2 使用方式)
- 3.实现原理
- - [3.1 启动过程](#3.1 启动过程)
  - [3.2 任务添加和管理](#3.2 任务添加和管理)
  - [3.3 调度过程](#3.3 调度过程)
  - [3.4 执行原理](#3.4 执行原理)

0.简介

pg_cron是PostgreSQL中的一个简单的基于cron的任务调度插件，本文将从其基础知识（Linux中Cron的语法）、pg_cron安装使用方式以及实现原理来对其进行详细的分析。

1.基础知识

理解pg_cron可以先去了解Linux系统中的Cron，其是一种用于自动执行预定任务的工具，Linux中Cron语法如下，pg_cron也是基于此来实现的。

cpp 复制代码

#查看当前用户任务列表
crontab -l
#编辑任务列表
crontab -e
#语法，其时间部分包含五个或六个字段，分别是分钟、小时、日期、月份、星期和可选的年份。
#实际时间例子如下
* * * * *：每分钟运行一次任务。
0 * * * *：每小时的第0分钟运行一次任务。
0 0 * * *：每天的00:00（午夜）运行一次任务。
0 0 * * 1：每周一的00:00运行一次任务。
0 0 1 * *：每月1号的00:00运行一次任务。
#实际添加一个每天七点执行脚本run.sh格式如下，直接添加一行
0 7 * * * /path/run,sh

2.pg_cron安装使用方式

2.1 安装pg_cron

cpp 复制代码

git clone https://github.com/citusdata/pg_cron.git
cd pg_cron
#其使用的是pg_config中的信息（编译选项，安装路径等）
make && make install

#修改参数
postgres=# ALTER SYSTEM SET shared_preload_libraries TO pg_cron;
ALTER SYSTEM
postgres=# exit
#重启数据库
pg_ctl restart
#创建pg_cron插件
postgres=# CREATE EXTENSION pg_cron;
CREATE EXTENSION

2.2 使用方式

cpp 复制代码

#添加任务，每分钟执行
postgres=# SELECT cron.schedule('* * * * *', 'select 1;');
 schedule
----------
        1
(1 row)

#查看任务
postgres=# SELECT * FROM cron.job;
 jobid | schedule  |  command  | nodename  | nodeport | database | username | active | jobname
-------+-----------+-----------+-----------+----------+----------+----------+--------+---------
     1 | * * * * * | select 1; | localhost |     6688 | postgres | admin    | t      |
(1 row)

#删除任务
postgres=#  SELECT cron.unschedule(1);
 unschedule
------------
 t
(1 row)

#再次查看
postgres=# SELECT c* FROM cron.job;
 jobid | schedule | command | nodename | nodeport | database | username | active | jobname
-------+----------+---------+----------+----------+----------+----------+--------+---------
(0 rows)

3.实现原理

3.1 启动过程

启动过程需要理解的内容是如何去启动pg_cron，对于PG来说，其为多进程的架构，后台主进程是postmaster，在其启动是会调用process_shared_preload_libraries();函数去加载外部插件，对于插件加载过程包含了环境检查和主函数注册，主函数由插件中_PG_init()完成注册，函数从外部加载，由postmaster执行。

cpp 复制代码

PG_init = (PG_init_t) pg_dlsym(file_scanner->handle, "_PG_init");
if (PG_init)
    (*PG_init) ();

对于pg_cron来说，_PG_init 函数对于主函数进行了注册：将 PgCronLauncherMain配置为一个后台 worker 并且注册到列表中。到这里系统回到了 postmaster 进程中继续执行任务，直到执行到 maybe_start_bgworkers() 函数，尝试将 workerlist 列表中的worker启动。（这个执行的过程还与数据库的模式有关，处于 standby mode 状态下的数据库不会去启动 pg_cron） postmaster 会分配一个 background work给pg_cron , 之后pg_cron 进程独立运行，进程如下。