Hive 中 sort by 和 order by 的区别

order by会对输入做全局排序,因此只有1个reducer(多个reducer无法保证全局有序),会导致当输入规模较大时,需要较长的计算时间。

sort by不是全局排序,其在数据进入 reducer 前完成排序。

因此,如果用 sort by 进行排序,并且设置 mapred.reduce.tasks>1, 则 sort by 只保证每个 reducer 的输出有序,不保证全局有序


我们下期见,拜拜!

相关推荐
梦里不知身是客117 分钟前
hiveserver2服务的作用和启动
hive
梦里不知身是客112 小时前
hive让分区关联数据的三种方式
数据仓库·hive·hadoop
咨询QQ8762239653 小时前
从 Lumerical 和 COMSOL 中提取光栅反射相位
hive
m0_740043731 天前
Spring_全面详解入门
数据仓库·hive·hadoop
青云交2 天前
Java 大视界 -- Java 大数据在智能教育学习成果评估体系完善与教育质量提升中的深度应用(434)
java·hive·spark·智能教育·学习成果评估·教育质量提升·实时评估
咨询QQ:4877392783 天前
探索Qt下的UI皮肤生成器:多风格与编译那些事儿
hive
lalala_lulu3 天前
Jsp的四种作用域(超详细)
java·开发语言·hive
忘记9264 天前
Servlet 生命周期
数据仓库·hive·hadoop
天天向上杰4 天前
小识:从理财数仓角度看GaussDB、PostgreSQL、Hive 三区别
hive·hadoop·gaussdb
写代码的【黑咖啡】4 天前
Hive on Spark:加速大数据分析的新引擎
hive·数据分析·spark