Flink max maxby区别

max只会显示指定字段的大小变化,而maxBy会显示其他字段的变化。

max:取指定字段的当前的最大值,如果有多个字段,其他非比较字段,以第一条为准。

maxBy:取指定字段的当前的最大值,如果有多个字段,其他字段以最大值那条数据为准。这种比较符合常识。

举例,原始数据,如下:

java 复制代码
stock_277,22.3760055422398,SYSStock,1631002964777
stock_277,1.141256900167285,UDFStock,1631002965778
stock_277,43.238164914104345,UDFStock,1631002966779
stock_278,11.19084433119833,UDFStock,1631002967779
stock_278,1.029404720792922,SYSStock,1631002968779

max计算结果如下:

maxby计算结果如下:

注意:是按照id作为key进行分组,所以上面max和maxby的计算结果,都是在各自的分组中计算出来的。

相关推荐
智能化咨询1 小时前
Flink受管状态自定义序列化的可演进设计与未来趋势
flink
yumgpkpm2 小时前
CMP (类ClouderaCDP7.3(404次编译) )华为鲲鹏Aarch64(ARM)信创环境 查询2100w行 hive 查询策略
数据库·数据仓库·hive·hadoop·flink·mapreduce·big data
wudl55665 小时前
Flink 1.20 flink-config.yml 配置详解
大数据·flink
华东数交5 小时前
企业与国有数据资产:入表全流程管理及资产化闭环理论解析
大数据·人工智能
B站_计算机毕业设计之家10 小时前
计算机毕业设计:Python农业数据可视化分析系统 气象数据 农业生产 粮食数据 播种数据 爬虫 Django框架 天气数据 降水量(源码+文档)✅
大数据·爬虫·python·机器学习·信息可视化·课程设计·农业
Apache Flink12 小时前
Flink Agents 0.1.0 发布公告
大数据·flink
潘达斯奈基~14 小时前
在使用spark的applyInPandas方法过程中,遇到类型冲突问题如何解决
大数据·笔记
火星资讯15 小时前
腾多多数字零售模式:从成本转嫁到全生态共赢的破局实践
大数据
望获linux16 小时前
【实时Linux实战系列】实时 Linux 的自动化基准测试框架
java·大数据·linux·运维·网络·elasticsearch·搜索引擎
金宗汉16 小时前
《宇宙递归拓扑学:基于自指性与拓扑流形的无限逼近模型》
大数据·人工智能·笔记·算法·观察者模式