hive中date_add的一点小说明

在上家公司做理赔数据迁移的时候,遇到一个问题:

理赔的任务都是有时间节点的,有的是到天的,有的是到小时的,有的是到分钟的等等。具体的业务是这样的:算一个地区前30天的理赔金额(口径是到分钟的),用的是date_add计算的,导致数据多了300多万

问题所在:

在Hive中,date_add函数用于将指定的天数添加到给定的日期上,从而得到一个新的日期。如果日期是代时分秒的:'2024-10-23 14:12:30',用date_add加一天得到的是:2024-10-24,时分秒没有了,所以会导致统计出的金额有问题。

解决方案:使用interval解决

把date_add('2024-10-23 14:12:30',-30) 换成:'2024-10-23 14:12:30' - interval 30 day就可以解决了。

图片晚上不上

相关推荐
D明明就是我32 分钟前
Hive 拉链表
数据仓库·hive·hadoop
嘉禾望岗5034 小时前
hive join优化和数据倾斜处理
数据仓库·hive·hadoop
yumgpkpm5 小时前
华为鲲鹏 Aarch64 环境下多 Oracle 数据库汇聚操作指南 CMP(类 Cloudera CDP 7.3)
大数据·hive·hadoop·elasticsearch·zookeeper·big data·cloudera
忧郁火龙果6 小时前
六、Hive的基本使用
数据仓库·hive·hadoop
忧郁火龙果6 小时前
五、安装配置hive
数据仓库·hive·hadoop
chad__chang20 小时前
dolphinscheduler安装过程
hive·hadoop
ajax_beijing1 天前
hadoop的三副本数据冗余策略
大数据·hadoop·分布式
yumgpkpm2 天前
CMP (类ClouderaCDP7.3(404次编译) )华为鲲鹏Aarch64(ARM)信创环境多个mysql数据库汇聚的操作指南
大数据·hive·hadoop·zookeeper·big data·cloudera
华阙之梦2 天前
【在 Windows 上运行 Apache Hadoop 或 Spark/GeoTrellis 涉及 HDFS 】
hadoop·windows·apache
还是大剑师兰特2 天前
Hadoop面试题及详细答案 110题 (96-105)-- Hadoop性能优化
hadoop·大剑师·hadoop面试题