一、偏移量函数

lag

语法：lag(col,n,default_val)

返回值：字段类型

说明：往前第n行数据。

lag(column字段，第n行，默认值)

lag函数能够取出往前n行的数据值，如果数据为空值，则取默认值

语法：lead(col,n, default_val)

返回值：字段类型

说明：往后第n行数据。

lead(column字段，第n行，默认值)

lead函数能够取出往后n行的数据，如果数据为空值，则取默认值

Tip:lead的英文翻译为领先的，这里的领先指的是当前数据行，因此想要取往后的数据需要使用lead
Tip:lag的英文翻译为落后的，这里的落后指的是当前数据行，因此想要取往前的数据需要使用lag

语法：first_value (col,true/false)

返回值：字段类型

说明：当前窗口下的第一个值，第二个参数为true，跳过空值。

first_value能够取出当前窗口下的第一个值，第二参数能够选择跳过空值。

语法：last_value (col,true/false)

返回值：字段类型

说明：当前窗口下的最后一个值，第二个参数为true，跳过空值。

last_value能够取出当前窗口下的第一个值，第二参数能够选择跳过空值。

Tip:窗口分析函数通常需要对分区数据进行order by排序，经过排序后的再使用窗口分析函数

语法：rank() over(......)

返回值：int

说明：排名相同时会重复，总数不会减少（12225......）。

rank为跳跃排序函数

语法：dense_rank() over(......)

返回值：int

说明：排名相同时会重复，总数会减少（12223......）。

dense_rank为不跳跃排序函数

语法：row_number() over(......)

返回值：int

说明：数据值相同时不会重复，总数不会减少（1234567......）。

row_number为顺序唯一排序函数

Tip:排序函数为面试常考题目，务必掌握捏。