Flink max maxby区别

max只会显示指定字段的大小变化,而maxBy会显示其他字段的变化。

max:取指定字段的当前的最大值,如果有多个字段,其他非比较字段,以第一条为准。

maxBy:取指定字段的当前的最大值,如果有多个字段,其他字段以最大值那条数据为准。这种比较符合常识。

举例,原始数据,如下:

java 复制代码
stock_277,22.3760055422398,SYSStock,1631002964777
stock_277,1.141256900167285,UDFStock,1631002965778
stock_277,43.238164914104345,UDFStock,1631002966779
stock_278,11.19084433119833,UDFStock,1631002967779
stock_278,1.029404720792922,SYSStock,1631002968779

max计算结果如下:

maxby计算结果如下:

注意:是按照id作为key进行分组,所以上面max和maxby的计算结果,都是在各自的分组中计算出来的。

相关推荐
大刘讲IT7 小时前
数据治理体系的“三驾马车”:质量、安全与价值挖掘
大数据·运维·经验分享·学习·安全·制造·零售
悻运8 小时前
Spark论述及其作用
大数据·分布式·spark
szxinmai主板定制专家8 小时前
国产RK3568+FPGA以 ‌“实时控制+高精度采集+灵活扩展”‌ 为核心的解决方案
大数据·运维·网络·人工智能·fpga开发·机器人
细心的莽夫10 小时前
Elasticsearch复习笔记
java·大数据·spring boot·笔记·后端·elasticsearch·docker
痕51710 小时前
spark和Hadoop之间的对比和联系
大数据·hadoop·spark
CXH72811 小时前
hadoop分布式部署
大数据·hadoop·分布式
码农周11 小时前
Elasticsearch 报错 Limit of total fields [1000] has been exceeded
大数据·elasticsearch
晴天彩虹雨11 小时前
实时数仓体系概览与架构演进
数据仓库·clickhouse·架构·flink·kafka
1momomo汉堡包12 小时前
spark和hadoop之间的对比和联系
大数据·hadoop·spark
Elastic 中国社区官方博客13 小时前
Elasticsearch 堆内存使用情况和 JVM 垃圾回收
大数据·jvm·数据库·elasticsearch·搜索引擎·全文检索