hive中date_add的一点小说明

在上家公司做理赔数据迁移的时候,遇到一个问题:

理赔的任务都是有时间节点的,有的是到天的,有的是到小时的,有的是到分钟的等等。具体的业务是这样的:算一个地区前30天的理赔金额(口径是到分钟的),用的是date_add计算的,导致数据多了300多万

问题所在:

在Hive中,date_add函数用于将指定的天数添加到给定的日期上,从而得到一个新的日期。如果日期是代时分秒的:'2024-10-23 14:12:30',用date_add加一天得到的是:2024-10-24,时分秒没有了,所以会导致统计出的金额有问题。

解决方案:使用interval解决

把date_add('2024-10-23 14:12:30',-30) 换成:'2024-10-23 14:12:30' - interval 30 day就可以解决了。

图片晚上不上

相关推荐
修先生7 小时前
Hive Udf函数AES加密
hive·aes·udf
Volunteer Technology13 小时前
HDFS源码(二)
大数据·hadoop·hdfs
WL_Aurora13 小时前
MapReduce框架原理深度解析 | Shuffle机制、切片分区、Join全攻略
大数据·hadoop·mapreduce
赵渝强老师13 小时前
【赵渝强老师】Hadoop的伪分布部署模式
大数据·hadoop·分布式
Volunteer Technology14 小时前
HDFS源码(一)
大数据·hadoop·hdfs
WL_Aurora1 天前
HDFS底层原理深度解析 | 读写流程、NameNode工作机制、DataNode心跳与数据完整性
大数据·hadoop·hdfs
m0_716255002 天前
二、Hadoop 面试必背 | 三、Hive 面试必背
大数据·hadoop·面试
Volunteer Technology2 天前
HDFS扩缩容及数据迁移
大数据·hadoop·hdfs
Volunteer Technology2 天前
Hadoop NameNode HA
大数据·hadoop·分布式
大大大大晴天3 天前
Flink集群跨机房容灾:HDFS 快照权限踩坑与实践
hadoop·flink