最近帮忙跟进个oracle11g upgrade 升级到19c 的项目,由于业主方不太熟悉oracle upgrade相关升级流程,以及升级影响范围相关的事项,担心应用停机升级以后会导致数据库保存的业务数据不一致。🙂↔️
虽然我们一直跟业主方强调,upgrade 升级只会升级oracle 二进制安装文件和数据库系统数据字典相关的内容进行升级,不会修改业务数据,而且我们是迁移+升级不会修改源库内容,有回退方案。😎
但是业主表示需要提供数据验证的方案,这个流程不能缺,没办法只能提供数据对比方案:
- 通过生产的备份集+归档搭建2套DG库,A库用于升级19C,B库用于保留原始数据。
- A库升级完成以后搭建DBLINK和B库进行数据比对,查询A库升级后和B库数据是否会不一致。
以下提供两个存储过程来判断校验升级前后数据是否有差异:
- diff_plobj_proc:该存储过程对比源端、目标端业务用户所有的对象(PL/SQL对象,表,视图,序列等等)。
- diff_row_proc:该存储过程对比源端、目标端业务用户所有的表对象的数据是否一致,差集如果不等于0为数据不一致。
diff_plobj_proc 过程代码:
--------------------------------注意:--------------------------------------------
diff_plobj_proc 过程建议在目标端实例(19C)上SYS、system 或者具有DBA角色的用户执行。
因为 diff_plobj_proc 存储过程逻辑没有考虑到业务用户对于系统表访问权限这块的访问,
所以目标端(19C)创建访问源端(11G)的DBLINK使用的数据库用户最好是有SYSTEM 或者 SYS 或者 DBA的权限,
才能访问DBA_系列的系统试图。
--------------------------------注意:--------------------------------------------
drop TABLE diff_plobj_table;
CREATE TABLE diff_plobj_table(
source_schema_name VARCHAR2(200),
source_obj_name VARCHAR2(200) ,
source_obj_type VARCHAR2(200) ,
source_status VARCHAR2(200) ,
target_schema_name VARCHAR2(200) ,
target_obj_name VARCHAR2(200) ,
target_obj_type VARCHAR2(200) ,
target_status VARCHAR2(200),
proc_exce_time DATE
);
COMMENT ON TABLE diff_plobj_table IS 'plsql对象比对表';
COMMENT ON COLUMN diff_plobj_table.source_schema_name IS 'source_schema_name 源端业务模式名';
COMMENT ON COLUMN diff_plobj_table.source_obj_name IS 'source_obj_type 源端对象名称';
COMMENT ON COLUMN diff_plobj_table.source_obj_type IS 'source_obj_type 源端对象类型';
COMMENT ON COLUMN diff_plobj_table.source_status IS 'source_status 源端对象状态';
COMMENT ON COLUMN diff_plobj_table.target_schema_name IS 'target_schema_name 目标端业务模式名';
COMMENT ON COLUMN diff_plobj_table.target_obj_name IS 'target_obj_type 目标端对象名称';
COMMENT ON COLUMN diff_plobj_table.target_obj_type IS 'target_obj_type 目标端对象类型';
COMMENT ON COLUMN diff_plobj_table.target_status IS 'target_status 目标端对象状态';
COMMENT ON COLUMN diff_plobj_table.proc_exce_time IS 'diff_plobj_proc 存储过程运行的时间';
-- diff_plobj_proc 过程对比源端、目标段的业务用户的对象
CREATE OR REPLACE PROCEDURE diff_plobj_proc(
p_source_db_link_name IN VARCHAR2,
p_source_schema_name IN VARCHAR2,
p_target_schema_name IN VARCHAR2
) IS
/* 统一将传进来的参数转换成大写 */
v_source_db_link_name VARCHAR2(200) := '@' || UPPER(p_source_db_link_name);
v_source_schema_name VARCHAR2(200) := UPPER(p_source_schema_name);
v_target_schema_name VARCHAR2(200) := UPPER(p_target_schema_name);
v_sql VARCHAR2(4000);
v_link_name_flag VARCHAR2(10);
-- 定义个 ref 游标变量用来接收 v_sql 返回的结果集
v_sql_ref_cursor SYS_REFCURSOR;
-- 定义个 record 类型用来保存 v_sql 返回的结果集
TYPE v_sql_record_type IS RECORD (
source_schema_name VARCHAR2(500),
source_obj_name VARCHAR2(500),
source_obj_type VARCHAR2(500),
source_status VARCHAR2(500),
target_schema_name VARCHAR2(500),
target_obj_name VARCHAR2(500),
target_obj_type VARCHAR2(500),
target_status VARCHAR2(500),
proc_exce_time DATE
);
v_sql_record_row v_sql_record_type;
BEGIN
EXECUTE IMMEDIATE 'TRUNCATE TABLE diff_plobj_table';
/* 判断传入的 v_source_db_link_name 是否有效,如果无效报错 */
BEGIN
v_sql := 'SELECT 1 FROM DUAL' || v_source_db_link_name;
EXECUTE IMMEDIATE v_sql INTO v_link_name_flag;
EXCEPTION
WHEN OTHERS THEN
raise_application_error(-20001, v_source_db_link_name || ':dblink无效,请检查dblink是否可用!');
END;
/* 动态 SQL 拼接 */
v_sql := 'SELECT DISTINCT ' ||
'a.owner AS source_schema_name, ' ||
'(CASE ' ||
' WHEN a.object_type = ''INDEX'' THEN ' ||
' (SELECT LISTAGG(''IDX_'' || COLUMN_NAME, ''_'') WITHIN GROUP (ORDER BY COLUMN_POSITION) ' ||
' FROM ALL_IND_COLUMNS aic ' ||
' WHERE INDEX_NAME = a.object_name) ' ||
' ELSE a.object_name ' ||
' END) AS source_obj_name, ' ||
'a.object_type AS source_obj_type, ' ||
'a.status AS source_status, ' ||
'b.owner AS target_schema_name, ' ||
'(CASE ' ||
' WHEN b.object_type = ''INDEX'' THEN ' ||
' (SELECT LISTAGG(''IDX_'' || COLUMN_NAME, ''_'') WITHIN GROUP (ORDER BY COLUMN_POSITION) ' ||
' FROM ALL_IND_COLUMNS bic ' ||
' WHERE INDEX_NAME = b.object_name) ' ||
' ELSE b.object_name ' ||
' END) AS target_obj_name, ' ||
'b.object_type AS target_obj_type, ' ||
'b.status AS target_status, ' ||
'SYSDATE AS proc_exce_time ' ||
'FROM (SELECT owner, object_name, object_type, status FROM DBA_OBJECTS' || v_source_db_link_name || ' WHERE owner = ''' || v_source_schema_name || ''') a ' ||
'FULL JOIN (SELECT owner, object_name, object_type, status FROM DBA_OBJECTS WHERE OWNER = ''' || v_target_schema_name || ''') b ' ||
'ON a.OBJECT_NAME = b.OBJECT_NAME AND a.OBJECT_TYPE = b.OBJECT_TYPE';
-- 打开游标并执行动态 SQL
OPEN v_sql_ref_cursor FOR v_sql;
-- 使用 LOOP 循环遍历游标
LOOP
FETCH v_sql_ref_cursor INTO v_sql_record_row;
EXIT WHEN v_sql_ref_cursor%NOTFOUND;
-- 插入 diff_plobj_table 表
INSERT INTO diff_plobj_table VALUES v_sql_record_row;
END LOOP;
CLOSE v_sql_ref_cursor;
COMMIT;
END;
/
-- 执行存储过程 ,我的环境 源端和目标端的 业务SCHEMA 不一样,生产环境是一样的。
BEGIN
diff_plobj_proc(
p_source_db_link_name => 'SCOTT2_LINK',
p_source_schema_name => 'SCOTT2',
p_target_schema_name => 'SCOTT3');
END;
/
-- 查询表 diff_plobj_table 能获取源端和目标端的对象明细。
SELECT * FROM diff_plobj_table;
-- 查询源端、目标端对象数据比对
SELECT *
FROM (SELECT COUNT(1) source_cnt,
source_obj_type
FROM diff_plobj_table
GROUP BY source_obj_type) so
FULL JOIN (SELECT COUNT(1) target_cnt,
TARGET_OBJ_TYPE
FROM diff_plobj_table
GROUP BY TARGET_OBJ_TYPE) tg ON so.SOURCE_OBJ_TYPE = tg.TARGET_OBJ_TYPE
ORDER BY 1;
diff_row_proc 过程代码:
--------------------------------注意:--------------------------------------------
diff_row_proc 过程建议在目标端实例(19C)上SYS、system 或者具有DBA角色的用户执行。
因为 diff_row_proc 存储过程逻辑没有考虑到业务用户对于系统表访问权限这块的访问,
所以目标端(19C)创建访问源端(11G)的DBLINK使用的数据库用户最好是有SYSTEM 或者 SYS 或者 DBA的权限,
才能访问DBA_系列的系统试图。
--------------------------------注意:--------------------------------------------
drop TABLE diff_row_table;
CREATE TABLE diff_row_table(
source_schema_name VARCHAR2(200),
source_table_name VARCHAR2(200) ,
source_table_row_total_cnt INT,
target_schema_name VARCHAR2(200) ,
target_table_name VARCHAR2(200) ,
target_table_row_total_cnt INT ,
source_target_diff_row INT,
proc_exce_time DATE
);
COMMENT ON TABLE diff_row_table IS '对比源端、目标段表行数据差异表';
COMMENT ON COLUMN diff_row_table.source_schema_name IS 'source_schema_name 源端业务模式名';
COMMENT ON COLUMN diff_row_table.source_table_name IS 'source_table_name 源端表对象名称';
COMMENT ON COLUMN diff_row_table.source_table_row_total_cnt IS 'source_table_row_total_cnt 源端表对象行数统计';
COMMENT ON COLUMN diff_row_table.target_schema_name IS 'target_schema_name 目标端业务模式名';
COMMENT ON COLUMN diff_row_table.target_table_name IS 'target_table_name 目标端表对象名称';
COMMENT ON COLUMN diff_row_table.target_table_row_total_cnt IS 'target_table_row_total_cnt 目标端表对象行数统计';
COMMENT ON COLUMN diff_row_table.source_target_diff_row IS '源端和目标端表对比行数差异,通过主键对比';
COMMENT ON COLUMN diff_row_table.proc_exce_time IS 'diff_row_table 存储过程运行的时间';
-- 存储过程 diff_row_proc
CREATE OR REPLACE PROCEDURE diff_row_proc (
p_source_db_link_name IN VARCHAR2,
p_source_schema_name IN VARCHAR2,
p_target_schema_name IN VARCHAR2
) AS
v_source_db_link_name VARCHAR2(200) := '@' || UPPER(p_source_db_link_name);
v_source_schema_name VARCHAR2(200) := UPPER(p_source_schema_name);
v_target_schema_name VARCHAR2(200) := UPPER(p_target_schema_name);
v_link_name_flag CHAR;
v_sql VARCHAR2(4000);
-- 保存源端表表名的数组变量
v_source_table_name_arr DBMS_SQL.VARCHAR2_TABLE;
-- 保存目标端表名的数组变量
v_target_table_name_arr DBMS_SQL.VARCHAR2_TABLE;
-- 获取源端业务用户所有表名SQL变量(动态SQL)
v_source_table_sqlstr VARCHAR2(4000);
-- 获取目标端业务用户所有表名SQL变量(动态SQL)
v_target_table_sqlstr VARCHAR2(4000);
-- 定义 ref 游标变量用来接收 v_source_table_sqlstr 返回的结果集
v_source_sql_ref_cursor SYS_REFCURSOR;
-- 定义 ref 游标变量用来接收 v_target_table_sqlstr 返回的结果集
v_target_sql_ref_cursor SYS_REFCURSOR;
-- 定义变量存储行数和 MINUS 操作的结果计数
v_source_row_count PLS_INTEGER;
v_target_row_count PLS_INTEGER;
v_diff_count PLS_INTEGER;
v_match_found BOOLEAN := FALSE;
BEGIN
EXECUTE IMMEDIATE 'TRUNCATE TABLE DIFF_ROW_TABLE';
/* 判断传入的 v_source_db_link_name 是否有效,如果无效报错 */
BEGIN
v_sql := 'SELECT 1 FROM DUAL' || v_source_db_link_name;
EXECUTE IMMEDIATE v_sql INTO v_link_name_flag;
EXCEPTION
WHEN OTHERS THEN
raise_application_error(-20001, v_source_db_link_name || ':dblink无效,请检查dblink是否可用!');
END;
-- 源端获取业务表名 SQL
v_source_table_sqlstr := 'SELECT a.TABLE_NAME FROM DBA_TABLES' ||
v_source_db_link_name || ' a WHERE a.owner = ''' ||
v_source_schema_name || ''' ORDER BY NUM_ROWS';
DBMS_OUTPUT.PUT_LINE(v_source_table_sqlstr);
-- 目标端获取业务表名 SQL
v_target_table_sqlstr := 'SELECT a.TABLE_NAME FROM DBA_TABLES' ||
' a WHERE a.owner = ''' ||
v_target_schema_name || ''' ORDER BY NUM_ROWS';
-- 打开游标并执行动态 SQL
OPEN v_source_sql_ref_cursor FOR v_source_table_sqlstr;
OPEN v_target_sql_ref_cursor FOR v_target_table_sqlstr;
-- 使用 BULK COLLECT INTO 将结果集批量插入数组
FETCH v_source_sql_ref_cursor BULK COLLECT INTO v_source_table_name_arr;
FETCH v_target_sql_ref_cursor BULK COLLECT INTO v_target_table_name_arr;
-- 关闭游标
CLOSE v_source_sql_ref_cursor;
CLOSE v_target_sql_ref_cursor;
-- 比较表名并进行 MINUS 操作
FOR i IN 1..v_source_table_name_arr.COUNT LOOP
v_match_found := FALSE; -- 重置标志
FOR j IN 1..v_target_table_name_arr.COUNT LOOP
IF v_source_table_name_arr(i) = v_target_table_name_arr(j) THEN
v_match_found := TRUE;
-- 获取源端表行数
v_sql := 'SELECT COUNT(*) FROM ' || v_source_schema_name || '.' || v_source_table_name_arr(i) || v_source_db_link_name;
EXECUTE IMMEDIATE v_sql INTO v_source_row_count;
-- 获取目标端表行数
v_sql := 'SELECT COUNT(*) FROM ' || v_target_schema_name || '.' || v_target_table_name_arr(j);
EXECUTE IMMEDIATE v_sql INTO v_target_row_count;
-- 进行 MINUS 操作并存储结果
BEGIN
BEGIN
v_sql := 'SELECT /*+ PARALLEL(8) */COUNT(*) FROM (' ||
'SELECT * FROM ' || v_source_schema_name || '.' || v_source_table_name_arr(i) || v_source_db_link_name ||
' MINUS ' ||
'SELECT * FROM ' || v_target_schema_name || '.' || v_target_table_name_arr(j) ||
')';
EXECUTE IMMEDIATE v_sql INTO v_diff_count;
EXCEPTION
WHEN OTHERS THEN
v_diff_count := -999;
END;
END;
-- 将结果插入 diff_row_table
INSERT INTO diff_row_table (
source_schema_name,
source_table_name,
source_table_row_total_cnt,
target_schema_name,
target_table_name,
target_table_row_total_cnt,
source_target_diff_row,
proc_exce_time
) VALUES (
v_source_schema_name,
v_source_table_name_arr(i),
v_source_row_count,
v_target_schema_name,
v_target_table_name_arr(j),
v_target_row_count,
v_diff_count,
SYSDATE
);
COMMIT;
-- 跳出内层循环
EXIT;
END IF;
END LOOP;
-- 如果未找到匹配的表名,输出提示信息并插入记录
IF NOT v_match_found THEN
DBMS_OUTPUT.PUT_LINE('Source table ' || v_source_table_name_arr(i) || ' has no matching target table');
-- 插入没有匹配表的记录
INSERT INTO diff_row_table (
source_schema_name,
source_table_name,
source_table_row_total_cnt,
target_schema_name,
target_table_name,
target_table_row_total_cnt,
source_target_diff_row,
proc_exce_time
) VALUES (
v_source_schema_name,
v_source_table_name_arr(i),
NULL, -- 源端表行数
v_target_schema_name,
NULL, -- 目标端表名
NULL, -- 目标端表行数
NULL, -- 源端和目标端表对比行数差异
SYSDATE
);
COMMIT;
END IF;
END LOOP;
END diff_row_proc;
-- 调用 diff_row_proc 比对源端和目标端的数据 ,该存储过程需要跑一段时间(可能很久)
BEGIN
diff_row_proc(
p_source_db_link_name => 'SCOTT2_LINK',
p_source_schema_name => 'SCOTT2',
p_target_schema_name => 'SCOTT3'
);
END;
/
-- 期间可以持续观察 diff_row_table 表
-- 如果 SOURCE_TARGET_DIFF_ROW 有 -999 的值,则表示源端表和目标端表包含大字段,需要手工获取主键或者唯一列进行MINUS进行差集比对。
-- 如果 SOURCE_TARGET_DIFF_ROW 有 > 0 的值,则表示源端表和目标端表数据不一致。
SELECT * FROM diff_row_table WHERE SOURCE_TARGET_DIFF_ROW <> 0;
最近一直在写c,pl/sql 也好久没写了,上面俩过程花了哥3个多小时才写出来😅,真的是捡一门丢一门,醉了😵💫。