技术栈

Hive 中 sort by 和 order by 的区别

闭关苦炼内功2023-07-25 15:17

order by会对输入做全局排序,因此只有1个reducer(多个reducer无法保证全局有序),会导致当输入规模较大时,需要较长的计算时间。

sort by不是全局排序,其在数据进入 reducer 前完成排序。

因此,如果用 sort by 进行排序,并且设置 mapred.reduce.tasks>1, 则 sort by 只保证每个 reducer 的输出有序,不保证全局有序。


我们下期见,拜拜!

上一篇:【算法】递增序列
下一篇:华为认证HCIA-HCIP-HCIEdatacom题库解析+机构视频+实验
相关推荐
Irene1991
21 小时前
Windows 11 WSL Ubuntu 环境:实际安装 Hive 踩坑实录
hive·windows·ubuntu
Irene1991
1 天前
(课堂笔记)Hive 分区、分桶与数据倾斜
hive·hadoop
Irene1991
2 天前
在 WSL Ubuntu 上安装和使用 Hive
linux·hive·ubuntu
Irene1991
2 天前
(课堂笔记)Hive 基础
hive·hadoop
水火既济__
3 天前
加快hive效率
数据仓库·hive·hadoop
lifewange
5 天前
Hive 数据库 增删改 完整操作指南
数据库·hive·hadoop
WL_Aurora
5 天前
Sqoop数据迁移工具从入门到精通
hive·hadoop·sqoop
小的~~
7 天前
CentOS7安装CDH6.3.2
hive·hdfs·kafka
青春万岁!!
8 天前
hive模型数据异常-作业调度问题
大数据·数据仓库·hive
白日与明月
9 天前
Hive分桶机制应用
数据仓库·hive·hadoop
热门推荐
01GitHub 镜像站点02Codex 接入 DeepSeek API 完整配置文档03CC-Switch & Claude 基于 Linux 服务器安装使用指南04【踩坑记录 | 第一篇】微软商店无法使用时,如何手动安装 OpenAI Codex?附`.msix`文件系统错误解决方法05几个好用的ip纯净度检测网站06【AI】2026 年具身智能模型和世界模型总结07裂开!ChatGPT 居然开始要手机号验证,附详细解决方法08装上就回不去了:CodeGraph 让 AI 编程效率飙升 92%,它到底做了什么?09codex app每次打开重连5次Reconnecting问题解决10用了半年 OpenRouter,我换到了 Ofox.ai — 两个 AI API 聚合平台的真实对比