问题复现
查询该表结果为100行
select count(1) as cnt
from (
select distinct a,b,c
from pageAds
)
查询下表条数为90行
select count(1) as cnt
from (
select distinct a,b,c
from pageAds
)
lateral view explode(split(a,',')) adTable as d
思考:第二条语句只比第一个多一个炸裂函数,炸裂函数的作用是将数据炸开变成多行数据,为什么还会条数变少了呢?
经过各种资料查找,数据探索,发现当字段是空时,不会形成新的一行,而是会把这条数据过滤掉
例如有20条a是空,那如果a都没有被分割,那就会生成80条数据,我这个a有被分割,所以生成了90条数据
注意:以后用这个的时候一定要探索好分割字段,当有空的时候提前把空值处理好,例如提前赋默认值
如下
select count(1) as cnt
from (
select distinct coalesce (case when a='' then ','
else a
end ,
',') as a
,b,c
from pageAds
)
lateral view explode(split(a,',')) adTable as d