hive中date_add的一点小说明

在上家公司做理赔数据迁移的时候,遇到一个问题:

理赔的任务都是有时间节点的,有的是到天的,有的是到小时的,有的是到分钟的等等。具体的业务是这样的:算一个地区前30天的理赔金额(口径是到分钟的),用的是date_add计算的,导致数据多了300多万

问题所在:

在Hive中,date_add函数用于将指定的天数添加到给定的日期上,从而得到一个新的日期。如果日期是代时分秒的:'2024-10-23 14:12:30',用date_add加一天得到的是:2024-10-24,时分秒没有了,所以会导致统计出的金额有问题。

解决方案:使用interval解决

把date_add('2024-10-23 14:12:30',-30) 换成:'2024-10-23 14:12:30' - interval 30 day就可以解决了。

图片晚上不上

相关推荐
孤影过客1 天前
驯服数据巨兽:Hadoop如何重塑大数据的黄金时代
大数据·hadoop·分布式
极光代码工作室1 天前
基于Hadoop的日志数据分析系统设计
大数据·hadoop·python·数据分析·数据可视化
tumeng07112 天前
HDFS的架构优势与基本操作
hadoop·hdfs·架构
蓝眸少年CY2 天前
Hive - 函数、压缩与优化
数据仓库·hive·hadoop
仗剑_走天涯2 天前
Hadoop 安装
大数据·hadoop·分布式
sunxunyong2 天前
HDFS nnsdy重新配置启动
大数据·hadoop·hdfs
bukeyiwanshui2 天前
Hadoop环境搭建
大数据·hadoop·分布式
Jianghong Jian2 天前
HDFS常用的JAVA API
大数据·hadoop·hdfs
迈巴赫车主3 天前
大数据:Hadoop(MapReduce)
大数据·hadoop·mapreduce
jasnet_u3 天前
CentOS上搭建hadoop-3.3.6集群(3节点)
hadoop·centos