HiveSQL中last_value函数的应用

一、背景

在以下数据中如何实现对每一个列按照更新时间取最新的非null值?

sql 复制代码
1   a      a      null  202301     202301
1   b      b      null  null       202302
1   null   c      null  null       202303
1   d      null   null  null       202304

如何实现 1  d   c  null  202301   202301

二、last_value函数的使用

sql 复制代码
select last_value(age) over(partition by a order by b,c desc)
sql 复制代码
SELECT id
      ,last_value(name,TRUE)    OVER (PARTITION BY id) name
      ,last_value(age,TRUE)     OVER (PARTITION BY id) name
      ,last_value(address,TRUE) OVER (PARTITION BY id) address
      ,last_value(ct_time,TRUE) OVER (PARTITION BY id) ct_time
      ,up_time
FROM 
(select *
from
(select 1 as id,'a' as name ,'a' as age,null as address,202301 as ct_time,202301 as up_time
union all
select 1 as id,'b' as name ,'b'  as age,null as address,null as ct_time,  202302 as up_time
union all
select 1 as id,null as name,'c'  as age,null as address,null as ct_time,  202303 as up_time
union all
select 1 as id,'d' as name ,null as age,null as address,null as ct_time,  202304 as up_time
) t
ORDER BY t.up_time asc
);
在上述sql中,使用last_value函数对每一个列按照主键id分组,取一个最新值,如果遇见null值,使用参数true进行忽略,最后再使用窗口函数row_number进行分组排序取最大一条数据即可实现数据合并。
相关推荐
方安乐4 小时前
python之向量、向量和、向量点积
开发语言·python·numpy
zh1570235 小时前
JavaScript中WorkerThreads解决服务端计算瓶颈
jvm·数据库·python
代码AI弗森5 小时前
一文理清楚“算力申请 / 成本测算 / 并发评估”
java·服务器·数据库
小小小米粒6 小时前
Collection单列集合、Map(Key - Value)双列集合,多继承实现。
java·开发语言·windows
摇滚侠6 小时前
expdp 查看帮助
java·数据库·oracle
czhc11400756636 小时前
C# 428 线程、异步
开发语言·c#
流年似水~6 小时前
MCP协议实战:从零搭建一个让Claude能“看见“数据库的工具服务
数据库·人工智能·程序人生·ai·ai编程
2401_871492856 小时前
Vue.js监听器watch利用回调函数处理级联下拉框数据联动
jvm·数据库·python
:1217 小时前
java基础
java·开发语言
志栋智能7 小时前
超自动化安全:构建智能安全运营的核心引擎
大数据·运维·服务器·数据库·安全·自动化·产品运营