Flink max maxby区别

max只会显示指定字段的大小变化,而maxBy会显示其他字段的变化。

max:取指定字段的当前的最大值,如果有多个字段,其他非比较字段,以第一条为准。

maxBy:取指定字段的当前的最大值,如果有多个字段,其他字段以最大值那条数据为准。这种比较符合常识。

举例,原始数据,如下:

java 复制代码
stock_277,22.3760055422398,SYSStock,1631002964777
stock_277,1.141256900167285,UDFStock,1631002965778
stock_277,43.238164914104345,UDFStock,1631002966779
stock_278,11.19084433119833,UDFStock,1631002967779
stock_278,1.029404720792922,SYSStock,1631002968779

max计算结果如下:

maxby计算结果如下:

注意:是按照id作为key进行分组,所以上面max和maxby的计算结果,都是在各自的分组中计算出来的。

相关推荐
tonyabasy15 小时前
Flink 实时数仓开发实战:SQL中也能做到资源精细化管理
flink
大大大大晴天1 天前
浅聊Flink实时关联计算的不适用场景
flink
大大大大晴天2 天前
深入解析 Flink Kafka Connector:原理、配置与最佳实践
flink
大大大大晴天3 天前
Hudi技术内幕:RecordPayload到RecordMerger
大数据
SelectDB4 天前
秒级弹性、最高降本 70%:SelectDB Serverless 如何重塑云数仓资源效率
大数据·后端·云原生
WhoAmI4 天前
MapReduce框架原理解析一:InputFormat
大数据·hadoop
WhoAmI4 天前
MapReduce框架原理解析三:OutputFormat
大数据·hadoop
WhoAmI4 天前
MapReduce框架原理解析二:Shuffle
大数据·hadoop
大大大大晴天5 天前
Hudi技术内幕:Key Generation原理与实践
大数据
得物技术8 天前
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
大数据·llm·ai编程