[Hive] if返回null和0的区别

  • count(if(pv>=1000000,1,0))
  • count(if(pv>=1000000,1,null))

区别

count(if(pv>=1000000,1,0))count(if(pv>=1000000,1,null)) 之间的区别在于对于不满足条件的情况下的处理方式。

  • count(if(pv>=1000000,1,0)):这个表达式中,如果 pv 的值大于等于 1000000,那么返回 1,否则返回 0。count() 函数会统计返回值为非空(非零)的次数。因此,这个表达式将计算满足条件 pv>=1000000 的记录数,并将不满足条件的记录视为 0,也会进行计数。

  • count(if(pv>=1000000,1,null)):这个表达式中,如果 pv 的值大于等于 1000000,那么返回 1,否则返回 null。count() 函数仅统计返回值为非空(非零)的次数,而 null 在计数时会被忽略。因此,这个表达式将只计算满足条件 pv>=1000000 的记录数。

简单来说,区别在于第一个表达式(使用 0)计数了所有记录,包括不满足条件的记录,而第二个表达式(使用 null)只计数满足条件的记录。

  • 如果你希望同时计算满足和不满足条件的记录数,可以使用第一个表达式。

  • 如果你希望统计满足条件的记录数,可以使用第二个表达式;

相关推荐
Francek Chen9 小时前
【大数据基础】大数据处理架构Hadoop:02 Hadoop生态系统
大数据·hadoop·分布式·hdfs·架构
zhixingheyi_tian11 小时前
Hadoop 之 行业生态
hadoop
徐先生 @_@|||11 小时前
大数据技术演进(从传统Hadoop到Spark到云原生的技术演进路径)
大数据·hadoop·spark
查士丁尼·绵1 天前
hadoop集群存算分离
hive·hdfs·zookeeper·spark·hbase·yarn·galera
weixin_457297101 天前
Hadoop面试题
大数据·hadoop·分布式
何亚告1 天前
记一次项目上hadoop数据迁移
大数据·hadoop·分布式
默默在路上1 天前
apache-hive-3.1.3 show databases;报错
hive·hadoop·apache
talle20211 天前
Hadoop分布式计算框架【MapReduce】
大数据·hadoop·mapreduce
QQ12958455041 天前
SSAS - 步骤一:通过VS2022新建项目
数据仓库·数据分析
走遍西兰花.jpg1 天前
Oracle,hive,gaussdb的区别
hive·oracle·gaussdb