oracle 加快expdp clob大字段导出速度的两种方式

html 复制代码
作者介绍:老苏,10余年DBA工作运维经验,擅长Oracle、MySQL、PG、Mongodb数据库运维(如安装迁移,性能优化、故障应急处理等)
公众号:老苏畅谈运维
欢迎关注本人公众号,更多精彩与您分享。

在做数据迁移、还原测试库以及其他需要导出、导入数据的需求下,我们常用到数据泵来进行数据的导出操作,但如果数据库中clob字段非常多,导出就会比较慢。数据库进行迁移时,如果停机窗口时间较短,那如何加快这个导出速度呢?

可能你会说,多开几个并行不就行了吗?事实上当你数据库中大对象数据量占用较大时候,你会发现开并行没有任何用,那么怎么解决这个问题呢?

那么解决方案是先排除大对象的表,然后这些大对象的表再通过rowid切片,使用多个进程进行导出导入,下面来详细介绍两种方式。

方法1:利用记录rowid的中间表

--创建一个表用于记录要导出表的rowid并分批,这里分成3批

--假设要导出的大字段表为SZR.T_CLOB

html 复制代码
create table szr.exp_rowid as select mod(rownum,3) sou_seq,rowid sou_rowid from SZR.T_CLOB;

--根据分批次数生成对应的parfile文件

html 复制代码
cat > expdp_t_clob_seq0.par << EOF
userid="/ as sysdba"
directory=dump_dir
dumpfile=expdp_t_clob0.dmp
logfile=expdp_t_clob0.log
cluster=no
tables=szr.t_clob
query=szr.t_clob:"where rowid in (select sou_rowid from szr.exp_rowid where sou_seq=0)"
EOF

cat > expdp_t_clob_seq1.par << EOF
userid="/ as sysdba"
directory=dump_dir
dumpfile=expdp_t_clob1.dmp
logfile=expdp_t_clob1.log
cluster=no
tables=szr.t_clob
query=szr.t_clob:"where rowid in (select sou_rowid from szr.exp_rowid where sou_seq=1)"
EOF

cat > expdp_t_clob_seq2.par << EOF
userid="/ as sysdba"
directory=dump_dir
dumpfile=expdp_t_clob2.dmp
logfile=expdp_t_clob2.log
cluster=no
tables=szr.t_clob
query=szr.t_clob:"where rowid in (select sou_rowid from szr.exp_rowid where sou_seq=2)"
EOF

执行导出

--执行导出

html 复制代码
nohup expdp parfile=expdp_t_clob_seq0.par > expdp_t_clob_seq0.par.out &
nohup expdp parfile=expdp_t_clob_seq1.par > expdp_t_clob_seq1.par.out &
nohup expdp parfile=expdp_t_clob_seq2.par > expdp_t_clob_seq2.par.out &

方法2: 利用dbms_rowid进行分割,生成导出脚本

原理:ROWID_BLOCK_NUMBER函数(该函数返回输入ROWID的数据块编号)

语法:

DBMS_ROWID.ROWID_BLOCK_NUMBER(

row_id IN ROWID,

ts_type_in IN VARCHAR2 DEFAULT 'SMAILLFILE')

返回值是number类型。

执行导出脚本:

chunk=3

for ((i=0;i<=2;i++));

do

nohup expdp '/ as sysdba' tables=SZR.T_CLOB query=SZR.T_CLOB:"where mod(dbms_rowid.rowid_block_number(rowid),{chunk}) = KaTeX parse error: Expected group as argument to '\\"' at position 6: {i}\\" ̲directory=dump_...{i}.dmp logfile=T_CLOB_{i}.log &

echo $i

done


如果要导入,则执行:

html 复制代码
impdp \'/ as sysdba\'  directory=dump_dir dumpfile=T_CLOB_0.dmp logfile=implog_T_CLOB0.log DATA_OPTIONS=DISABLE_APPEND_HINT CONTENT=DATA_ONLY
impdp \'/ as sysdba\'  directory=dump_dir dumpfile=T_CLOB_1.dmp logfile=implog_T_CLOB1.log DATA_OPTIONS=DISABLE_APPEND_HINT CONTENT=DATA_ONLY
impdp \'/ as sysdba\'  directory=dump_dir dumpfile=T_CLOB_2.dmp logfile=implog_T_CLOB2.log DATA_OPTIONS=DISABLE_APPEND_HINT CONTENT=DATA_ONLY

关注我,学习更多的数据库知识。

相关推荐
陌上丨2 小时前
Redis的Key和Value的设计原则有哪些?
数据库·redis·缓存
AI_56782 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
ccecw2 小时前
Mysql ONLY_FULL_GROUP_BY模式详解、group by非查询字段报错
数据库·mysql
JH30732 小时前
达梦数据库与MySQL的核心差异解析:从特性到实践
数据库·mysql
数据知道3 小时前
PostgreSQL 核心原理:如何利用多核 CPU 加速大数据量扫描(并行查询)
数据库·postgresql
七夜zippoe3 小时前
CANN Runtime任务描述序列化与持久化源码深度解码
大数据·运维·服务器·cann
麦聪聊数据4 小时前
Web 原生架构如何重塑企业级数据库协作流?
数据库·sql·低代码·架构
未来之窗软件服务4 小时前
数据库优化提速(四)新加坡房产系统开发数据库表结构—仙盟创梦IDE
数据库·数据库优化·计算机软考
Fcy6484 小时前
Linux下 进程(一)(冯诺依曼体系、操作系统、进程基本概念与基本操作)
linux·运维·服务器·进程
袁袁袁袁满4 小时前
Linux怎么查看最新下载的文件
linux·运维·服务器