hive中date_add的一点小说明

在上家公司做理赔数据迁移的时候,遇到一个问题:

理赔的任务都是有时间节点的,有的是到天的,有的是到小时的,有的是到分钟的等等。具体的业务是这样的:算一个地区前30天的理赔金额(口径是到分钟的),用的是date_add计算的,导致数据多了300多万

问题所在:

在Hive中,date_add函数用于将指定的天数添加到给定的日期上,从而得到一个新的日期。如果日期是代时分秒的:'2024-10-23 14:12:30',用date_add加一天得到的是:2024-10-24,时分秒没有了,所以会导致统计出的金额有问题。

解决方案:使用interval解决

把date_add('2024-10-23 14:12:30',-30) 换成:'2024-10-23 14:12:30' - interval 30 day就可以解决了。

图片晚上不上

相关推荐
Roselind_Yi12 小时前
云计算实验实操|Hadoop伪分布式部署+MapReduce编程实践(超详细图文版)
大数据·hadoop·经验分享·笔记·分布式·数据挖掘·云计算
hINs IONN2 天前
深入解析HDFS:定义、架构、原理、应用场景及常用命令
hadoop·hdfs·架构
隐于花海,等待花开2 天前
Hive 常用函数详细总结
数据仓库·hive·hadoop
docsz3 天前
据数据基座搭建
大数据·hadoop
隐于花海,等待花开4 天前
COLLECT_LIST函数详解
hive
隐于花海,等待花开4 天前
数据开发常问的技术性问题及解答
大数据·hive
曹宇飞丶4 天前
ambari server及元数据库(postgreSQL)迁移
hadoop·ambari
隐于花海,等待花开4 天前
窗口函数之排序函数详细解读及示例
大数据·数据库·hive
隐于花海,等待花开4 天前
Hive 正则函数详解与示例
数据仓库·hive·hadoop
隐于花海,等待花开4 天前
Hive专题:数据开发面试高频题(TopN、留存、连续登录等)
hive·hadoop·面试