前言
GaussDB是华为自主创新研发的分布式关系型数据库,为企业提供功能全面、稳定可靠、扩展性强、性能优越的企业级数据库服务。在实际业务场景使用中,为了提高工作效率,数据库GaussDB提供定时任务的功能,本节为大家讲解GaussDB如何创建和管理,序列及定时任务。
目录
[方法一: 声明字段类型为序列整型来定义标识符字段。](#方法一: 声明字段类型为序列整型来定义标识符字段。)
[步骤 1 创建测试表:](#步骤 1 创建测试表:)
[步骤 2 创建自定义存储过程:](#步骤 2 创建自定义存储过程:)
[步骤 3 创建任务:](#步骤 3 创建任务:)
[步骤 4 通过视图查看当前用户已创建的任务信息。](#步骤 4 通过视图查看当前用户已创建的任务信息。)
[步骤 5 停止任务。](#步骤 5 停止任务。)
[步骤 6 启动任务。](#步骤 6 启动任务。)
[步骤 7 修改任务属性:](#步骤 7 修改任务属性:)
[步骤 8 删除JOB。](#步骤 8 删除JOB。)
一、创建和管理序列
序列Sequence是用来产生唯一整数的数据库对象。序列的值是按照一定规则自增的整数。因为自增所以不重复,因此说Sequence具有唯一标识性。这也是Sequence常被用作主键的原因。
通过序列使某字段成为唯一标识符的方法有两种:
1)一种是声明字段的类型为序列整理,由数据库在后台自动创建一个对应的Sequence。
2)另一种是使用CREATE SEQUENCE自定义一个新的Sequence,然后将nextval('sequence_name')函数读取的序列值,指定为某一字段的默认值,这样该字段就可以作为唯一标识符。
1、操作步骤
方法一: 声明字段类型为序列整型来定义标识符字段。例如:
postgres=# CREATE TABLE T1
(
id serial,
name text
);
当结果显示为如下信息,则表示创建成功。
CREATE TABLE
方法二:
创建序列,并通过nextval('sequence_name')函数指定为某一字段的默认值。这种方式更灵活,可以为序列定义cache,一次预申请多个序列值,减少与GTM的交互次数,来提高性能。
1、创建序列
postgres=# CREATE SEQUENCE seq1 cache 100;
当结果显示为如下信息,则表示创建成功。
CREATE SEQUENCE
2、指定为某一字段的默认值,使该字段具有唯一标识属性。
postgres=# CREATE TABLE T2
(
id int not null default nextval('seq1'),
name text
);
当结果显示为如下信息,则表示默认值指定成功。
CREATE TABLE
3、指定序列与列的归属关系。
将序列和一个表的指定字段进行关联。这样,在删除那个字段或其所在表的时候会自动删除已关联的序列。
postgres=# ALTER SEQUENCE seq1 OWNED BY T2.id;
当结果显示为如下信息,则表示指定成功。
ALTER SEQUENCE
注意事项
新序列值的产生是靠GTM维护的,默认情况下,每申请一个序列值都要向GTM发送一次申请,GTM在当前值的基础上加上步长值作为产生的新值返回给调用者。GTM作为全局唯一的节点,势必成为性能的瓶颈,所以对于需要大量频繁产生序列号的操作,如使用Bulkload工具进行数据导入场景,是非常不推荐产生默认序列值的。比如,在下面所示的场景中, INSERT FROM SELECT语句的性能会非常慢。
postgres=# CREATE SEQUENCE newSeq1;
postgres=# CREATE TABLE newT1
(
id int not null default nextval('newSeq1'),
name text
);
postgres=# INSERT INTO newT1(name) SELECT name from T1;
可以提高性能的写法是(假设T1表导入newT1表中的数据为10000行):
postgres=# INSERT INTO newT1(id, name) SELECT id,name from T1;
postgres=# SELECT SETVAL('newSeq1',10000);
如果必须要在bulkload场景下产生默认序列值,则一定要为newSeq1定义足够大的cache,并且不要定义Maxvalue或者Minvalue。数据库会试图将nextval('sequence_name')的调用下推到Data Node,以提高性能。 目前GTM对并发的连接请求是有限制的,当Data Node很多时,将产生大量并发连接, 这时一定要控制bulkload的并发数目,避免耗尽GTM的连接资源。如果目标表为复制表(DISTRIBUTE BY REPLICATION)时下推将不能进行。当数据量较大时,这对数据库将是个灾难。除了性能问题之外,空间也可能会剧烈膨胀,在导入结束后,需要用vacuum full来恢复。推荐采用如上建议,不要在bulkload的场景中产生默认序列值。
另外,序列创建后,在每个节点上都维护了一张单行表,存储序列的定义及当前值,但此当前值并非GTM上的当前值,只是保存本节点与GTM交互后的状态。如果其他节点也向GTM申请了新值,或者调用了Setval修改了序列的状态,不会刷新本节点的单行表,但因每次申请序列值是向GTM申请,所以对序列正确性没有影响。
二、定时任务管理
当用户在使用数据库过程中,如果白天执行一些耗时比较长的任务(例如:统计数据汇总之类或从其他数据库同步数据的任务),会对正常的业务有性能影响,所以用户经常选择在晚上执行,这增加了用户的工作量。因此数据库GaussDB提供定时任务的功能,可以由用户创建定时任务,当任务时间点到达后可以自动触发任务的执行,从而可以减少用户户运维的工作量。
GaussDB提供定时任务的创建、任务到期自动执行、任务删除、修改任务属性(包括:任务id、任务的关闭开启、任务的触发时间、触发时间间隔、任务内容等)。
步骤 1 创建测试表:
postgres=# CREATE TABLE test(id int, time date);
当结果显示为如下信息,则表示创建成功。
CREATE TABLE
步骤 2 创建自定义存储过程:
postgres=# CREATE OR REPLACE PROCEDURE PRC_JOB_1()
AS
N_NUM integer :=1;
BEGIN
FOR I IN 1..1000 LOOP
INSERT INTO test VALUES(I,SYSDATE);
END LOOP;
END;
/
当结果显示为如下信息,则表示创建成功。
CREATE PROCEDURE
步骤 3 创建任务:
-
新创建的任务(未指定job_id)表示每隔1分钟执行一次存储过程PRC_JOB_1。
postgres=# call dbe_task.submit('call public.prc_job_1(); ', sysdate, 'interval ''1 minute''', :a);
job1
(1 row) -
指定job_id创建任务,其中job_id可用范围为1~32767。
postgres=# call dbe_task.id_submit(2,'call public.prc_job_1(); ', sysdate, 'interval ''1 minute''');
isubmit(1 row)
步骤 4 通过视图查看当前用户已创建的任务信息。
postgres=# select job,dbname,start_date,last_date,this_date,next_date,broken,status,interval,failures,what from my_jobs;
job | dbname | start_date | last_date | this_date | next_date | broken | status | interval | failures | what
-----+--------+---------------------+----------------------------+----------------------------+---------------------+--------+--------+---------------------+----------+---------------------------
1 | postgres | 2017-07-18 11:38:03 | 2017-07-18 13:53:03.607838 | 2017-07-18 13:53:03.607838 | 2017-07-18 13:54:03 | n | s | interval '1 minute' | 0 | call public.prc_job_1();
(1 row)
步骤 5 停止任务。
postgres=# call dbe_task.finish(1,true);
broken
--------
(1 row)
步骤 6 启动任务。
postgres=# call dbe_task.finish(1,false);
broken
--------
(1 row)
步骤 7 修改任务属性:
- 修改JOB的Next_date参数信息。
--修改Job1的Next_date为1小时以后开始执行。
postgres=# call dbe_task.next_time(1, sysdate+1.0/24);
next_date
-----------
(1 row)
- 修改JOB的Interval参数信息。
--修改Job1的Interval为每隔1小时执行一次。
postgres=# call dbe_task.interval(1,'sysdate + 1.0/24');
interval
----------
(1 row)
- 修改JOB的What参数信息。
--修改Job1的What为执行SQL语句"insert into public.test values(333, sysdate+5);"。
postgres=# call dbe_task.content(1,'insert into public.test values(333, sysdate+5);');
what
------
(1 row)
-
同时修改JOB的Next_date、Interval、What等多个参数信息。
postgres=# call dbe_task.update(1, 'call public.prc_job_1();', sysdate, 'interval ''1 minute''');
change(1 row)
步骤 8 删除JOB。
postgres=# call dbe_task.cancel(1);
remove
--------
(1 row)
三、总结
GaussDB数据库提供了便捷的定时任务功能,以满足不同的需求。在使用这个功能的同时,需要注意,定时任务的设置和使用需要谨慎,避免误删重要数据或影响业务正常运行。同时,也需要保证定时任务的可靠性和稳定性,避免出现任务漏执行或执行重复的情况。
在使用GaussDB数据库时,创建定时任务可以在很多场景中应用,同时可以帮助我们提高系统的运行效率,大大的增加了数据库的便利性。