CDC作业历史记录无法删除问题

背景

数据库开启CDC功能后,每天会生成大量的历史记录,即使达到参数"每个作业的最大历史记录"的阈值后也不会被删除,导致其它作业的历史记录被删除,无法查看以前的执行情况,非常不方便。

现象

数据库开启CDC后会创建"capture"和"cleanup"两个作业,capture作业会生成大量的历史记录,而且参数"每个作业的最大历史记录"不起作用,一直不删除。

分析

首先通过跟踪定位到SQL Agent服务在执行作业时调用存储过程msdb.dbo. sp_sqlagent_log_jobhistory处理作业历史记录。查看该存储过程的定义,首先把当前运行数据插入到历史记录表中。

然后通过@step_id判断是整个作业完成的记录还是执行过程中步骤的记录,如果是作业已经完成的记录,执行存储过程msdb.dbo.sp_jobhistory_row_limiter对历史记录进行清理。

查看存储过程msdb.dbo.sp_jobhistory_row_limiter的定义,首先从注册表中获取参数"所有作业最大行数"和"每个作业最大行数"的值。

先根据参数"每个作业最大行数"判断当前作业是否超过限制,并删除旧的记录。

然后根据参数"所有作业最大行数"判断所有作业历史记录是否超过限制,并删除旧的记录。

接下来分析为什么CDC的历史记录无法删除,通过跟踪定位到捕获作业调用存储过程[sys].[sp_cdc_scan]在一个没有退出方式的循环中扫描事务日志,并调用存储过程msdb.dbo. sp_sqlagent_log_jobhistory 记录历史记录,因为传递的@step_id的值代表这是执行步骤的记录,不是作业完成的记录,因此不会触发清理日志的存储过程,导致历史记录越积累越多。

总结:

  1. capture作业一直是运行的,所以记录的都是作业步骤的日志,不会执行到清理历史记录的步骤,导致历史记录越积累越多;

  2. 其它作业执行完成清理历史记录时,因为capture作业的历史记录越积累越多,达到"所有作业最大行数"的阈值,删除所有作业旧的历史记录。capture作业运行频繁,所以保留的大都是capture作业的历史记录,其它运行不频繁的作业的历史记录被删除。

解决

方法一:创建一个新的作业,定期删除CDC的作业历史记录。

复制代码
 1 CREATE PROC [dbo].[usp_gt_delete_cdc_job_history]
 2 AS
 3 BEGIN
 4   DECLARE @job_id UNIQUEIDENTIFIER;
 5 
 6     DECLARE cdc_job_cursor CURSOR FOR SELECT
 7     job_id
 8   FROM
 9     msdb.dbo.cdc_jobs
10   WHERE
11     job_type = 'capture';
12 
13     OPEN cdc_job_cursor;
14     FETCH NEXT FROM cdc_job_cursor INTO @job_id;
15     WHILE @@FETCH_STATUS = 0
16     BEGIN
17       EXECUTE msdb.dbo.sp_jobhistory_row_limiter @job_id;
18 
19       FETCH NEXT FROM cdc_job_cursor INTO @job_id;
20     END
21 
22     CLOSE cdc_job_cursor;
23     DEALLOCATE cdc_job_cursor;
24 END

方法二:到msdb中修改存储过程的定义,增加对CDC作业处理的逻辑。该方式已经反馈给微软,在SQL Server下一个版本会采用,也算对SQL Server做一点小贡献。

以下是具体的代码。

复制代码
 1 ELSE
 2 BEGIN
 3   IF EXISTS(SELECT 1 FROM msdb.sys.tables WHERE schema_id = SCHEMA_ID('dbo') AND name = 'cdc_jobs')
 4   BEGIN
 5     IF EXISTS(SELECT 1 FROM msdb.dbo.cdc_jobs WHERE job_id = @job_id AND job_type = 'capture')
 6     BEGIN
 7       EXECUTE msdb.dbo.sp_jobhistory_row_limiter @job_id
 8     END
 9   END
10 END

产品&服务

SQL专家云数据库智能运维平台
Moebius数据库多活集群

数据库协作运维服务

北京格瑞趋势科技有限公司是聚焦于数据服务的高新技术企业,成立于2008年,创始团队及核心技术人员来自微软和雅虎。微软数据平台金牌合作伙伴。通过产品+服务双轮驱动的业务模式,15年间累计服务4000+客户,覆盖互联网、市政、交通、电信、医疗、教育、电力、制造业等各个领域。