Flink max maxby区别

max只会显示指定字段的大小变化,而maxBy会显示其他字段的变化。

max:取指定字段的当前的最大值,如果有多个字段,其他非比较字段,以第一条为准。

maxBy:取指定字段的当前的最大值,如果有多个字段,其他字段以最大值那条数据为准。这种比较符合常识。

举例,原始数据,如下:

java 复制代码
stock_277,22.3760055422398,SYSStock,1631002964777
stock_277,1.141256900167285,UDFStock,1631002965778
stock_277,43.238164914104345,UDFStock,1631002966779
stock_278,11.19084433119833,UDFStock,1631002967779
stock_278,1.029404720792922,SYSStock,1631002968779

max计算结果如下:

maxby计算结果如下:

注意:是按照id作为key进行分组,所以上面max和maxby的计算结果,都是在各自的分组中计算出来的。

相关推荐
Data跳动5 小时前
Spark内存都消耗在哪里了?
大数据·分布式·spark
woshiabc1115 小时前
windows安装Elasticsearch及增删改查操作
大数据·elasticsearch·搜索引擎
lucky_syq6 小时前
Saprk和Flink的区别
大数据·flink
lucky_syq6 小时前
流式处理,为什么Flink比Spark Streaming好?
大数据·flink·spark
袋鼠云数栈6 小时前
深入浅出Flink CEP丨如何通过Flink SQL作业动态更新Flink CEP作业
大数据
小白学大数据7 小时前
如何使用Selenium处理JavaScript动态加载的内容?
大数据·javascript·爬虫·selenium·测试工具
15年网络推广青哥8 小时前
国际抖音TikTok矩阵运营的关键要素有哪些?
大数据·人工智能·矩阵
节点。csn8 小时前
Hadoop yarn安装
大数据·hadoop·分布式
arnold669 小时前
探索 ElasticSearch:性能优化之道
大数据·elasticsearch·性能优化
NiNg_1_23410 小时前
基于Hadoop的数据清洗
大数据·hadoop·分布式