oracle中的minus数据比对

1、要有唯一索引或者主键作为前提,减少数据冲突的数量。

2、当有in查询的时候,尽量用exists,这样能提高查询效率:

create table TF_F_USER_DIFF1 tablespace BD_TBS_EXP_DATA parallel 20

as select /*+ parallel(c,20) / * from TF_F_USER_DIFF c where not
exists(select /
+ parallel(a,10) */ user_id from TF_F_USER_CRM a where

a.user_id=c.user_id);

低效率查询是这样的:

create table TF_F_USER_DIFF1 tablespace BD_TBS_EXP_DATA parallel 20 as select /*+ parallel(c,20) / * from TF_F_USER_DIFF c where a.user_id not in(select /+ parallel(a,10) */ user_id from TF_F_USER_CRM a);

3、ORACLE中的minus内部实现是有唯一索引机制或者主键机制,所以不需要像在其他表数据比对软件中那样要指定唯一索引或者主键那么麻烦,这个大赞。

4、如果两张表的数据量差异太大的话,建议按每个列分别比对,而不是把所有的列放在一起直接minus,因为minus之后的结果需要关联查询,两张大表关联查询效率不高。

1)分别比对:select columnA,columnB from tableA minus select columnC,columnD from tableB,其中columnA,columnC分别是两张表的主键,这样就只比对columnB,columnD这两列了。

2)把所有的列放在一起比对:select columnA,columnB,columnE,columnF,columnG,coulumnH from tableA minus select columnC,columnD,columnL,columnM,columnN,coulumnI from tableB

5、找出既在A表中有数据,又在C表中有数据,其中VPN_ID、MEMBER_ROLE_ID、START_DATE是联合主键:

create table Tf_f_User_Member_CRM tablespace BD_TBS_EXP_DATA parallel

20 as SELECT /*+ parallel(c,20) */

  • FROM TF_F_USER_MEMBER_DIFF C WHERE EXISTS (SELECT /*+ parallel(a,10) */ a.vpn_id,a.member_role_id,a.start_date FROM ucr_group_online.TF_F_USER_MEMBER_DIFF A WHERE A.VPN_ID = C.VPN_ID AND
    A.MEMBER_ROLE_ID = C.MEMBER_ROLE_ID AND A.START_DATE = C.START_DATE);

最好不要用下面的SQL语句,因为它是等值查询,会发生笛卡尔积,导致数据成倍的增长,最终结果不准确:

create table Tf_f_User_Member_diff1 tablespace BD_TBS_EXP_DATA

parallel 20 as SELECT /*+ parallel(c,20) / / + parallel(a,20) / c.

FROM TF_F_USER_MEMBER_DIFF C, UCR_GROUP_ONLINE.TF_F_USER_MEMBER_DIFF A

WHERE A.VPN_ID = C.VPN_ID AND A.MEMBER_ROLE_ID = C.MEMBER_ROLE_ID AND

A.START_DATE = C.START_DATE;

6、找出只在C表中存在数据,A表中不存在相同的数据,其中VPN_ID、MEMBER_ROLE_ID、START_DATE是联合主键:

create table Tf_f_User_Member_CRM tablespace BD_TBS_EXP_DATA parallel

20 as SELECT /*+ parallel(c,20) */

  • FROM TF_F_USER_MEMBER_DIFF C WHERE not EXISTS (SELECT /*+ parallel(a,10) */ a.vpn_id,a.member_role_id,a.start_date FROM
    ucr_group_online.TF_F_USER_MEMBER_DIFF A WHERE A.VPN_ID = C.VPN_ID AND
    A.MEMBER_ROLE_ID = C.MEMBER_ROLE_ID AND A.START_DATE = C.START_DATE);

7、oracle中的minus有排重作用:比如A={1,2,3,4},B={5,6,7,7},虽然两边的数据量是一样的,数据是完全不同的,理应B minus A的数据量是4,但是B minus A={5,6,7},只有三条数据,就是因为minus排重了。A minus B={1,2,3,4},数据量是4,说明A表中没有重复数据。

相关推荐
weixin_4585801223 分钟前
如何在 Go 中直接将 AST 编译为可执行二进制文件?
jvm·数据库·python
Highcharts.js2 小时前
Highcharts Grid 中文站正式上线:表格数据处理的全新选择
前端·javascript·数据库·表格数据·highcharts·可视化图表·企业级图表
Elastic 中国社区官方博客6 小时前
Elasticsearch:使用 Agent Builder 的 A2A 实现 - 开发者的圣诞颂歌
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
2301_816660216 小时前
PHP怎么处理Eloquent Attribute Inference属性推断_Laravel从数据自动推导类型【操作】
jvm·数据库·python
qq_372154237 小时前
Go 中自定义类型与基础类型的显式转换规则详解
jvm·数据库·python
_下雨天.7 小时前
NoSQL之Redis配置与优化
数据库·redis·nosql
LiAo_1996_Y7 小时前
CSS如何实现文字渐变效果_通过background-clip实现艺术字
jvm·数据库·python
2401_887724507 小时前
CSS如何让表单在手机端友好展示_利用Flexbox实现堆叠排版
jvm·数据库·python
数据库小组7 小时前
MySQL 删库后怎么恢复?binlog2sql 之外,NineData 还能做什么
数据库·sql·mysql·安全·数据·ninedata·删库
zhangchaoxies8 小时前
Layui轮播图(carousel)怎么设置自动播放间隔
jvm·数据库·python