Flink max maxby区别

max只会显示指定字段的大小变化,而maxBy会显示其他字段的变化。

max:取指定字段的当前的最大值,如果有多个字段,其他非比较字段,以第一条为准。

maxBy:取指定字段的当前的最大值,如果有多个字段,其他字段以最大值那条数据为准。这种比较符合常识。

举例,原始数据,如下:

java 复制代码
stock_277,22.3760055422398,SYSStock,1631002964777
stock_277,1.141256900167285,UDFStock,1631002965778
stock_277,43.238164914104345,UDFStock,1631002966779
stock_278,11.19084433119833,UDFStock,1631002967779
stock_278,1.029404720792922,SYSStock,1631002968779

max计算结果如下:

maxby计算结果如下:

注意:是按照id作为key进行分组,所以上面max和maxby的计算结果,都是在各自的分组中计算出来的。

相关推荐
盛寒40 分钟前
自然语言处理 目录篇
大数据·自然语言处理
武子康1 小时前
大数据-276 Spark MLib - 基础介绍 机器学习算法 Bagging和Boosting区别 GBDT梯度提升树
大数据·人工智能·算法·机器学习·语言模型·spark-ml·boosting
武子康1 小时前
大数据-277 Spark MLib - 基础介绍 机器学习算法 Gradient Boosting GBDT算法原理 高效实现
大数据·人工智能·算法·机器学习·ai·spark-ml·boosting
咸鱼求放生9 小时前
es在Linux安装
大数据·elasticsearch·搜索引擎
人大博士的交易之路11 小时前
今日行情明日机会——20250606
大数据·数学建模·数据挖掘·数据分析·涨停回马枪
Leo.yuan14 小时前
数据库同步是什么意思?数据库架构有哪些?
大数据·数据库·oracle·数据分析·数据库架构
SelectDB技术团队14 小时前
从 ClickHouse、Druid、Kylin 到 Doris:网易云音乐 PB 级实时分析平台降本增效
大数据·数据仓库·clickhouse·kylin·实时分析
Web极客码16 小时前
在WordPress上添加隐私政策页面
大数据·人工智能·wordpress
Apache Flink16 小时前
Flink在B站的大规模云原生实践
大数据·云原生·flink
itachi-uchiha17 小时前
Docker部署Hive大数据组件
大数据·hive·docker