技术栈

Hive 中 sort by 和 order by 的区别

闭关苦炼内功2023-07-25 15:17

order by会对输入做全局排序,因此只有1个reducer(多个reducer无法保证全局有序),会导致当输入规模较大时,需要较长的计算时间。

sort by不是全局排序,其在数据进入 reducer 前完成排序。

因此,如果用 sort by 进行排序,并且设置 mapred.reduce.tasks>1, 则 sort by 只保证每个 reducer 的输出有序,不保证全局有序。


我们下期见,拜拜!

上一篇:【算法】递增序列
下一篇:华为认证HCIA-HCIP-HCIEdatacom题库解析+机构视频+实验
相关推荐
無森~
3 小时前
Hive 函数
hive·hadoop·sql
無森~
7 小时前
Hive核心SQL(基础)
hive·hadoop·sql
yumgpkpm
12 小时前
银行智能数据平台在Cloudera CDH6\CDP 7\CMP 7平台下的具体使用配置流程
大数据·hive·hadoop·数据挖掘·flink·spark·cloudera
查士丁尼·绵
2 天前
hadoop集群存算分离
hive·hdfs·zookeeper·spark·hbase·yarn·galera
默默在路上
2 天前
apache-hive-3.1.3 show databases;报错
hive·hadoop·apache
走遍西兰花.jpg
2 天前
Oracle,hive,gaussdb的区别
hive·oracle·gaussdb
梦痕长情
3 天前
记一次hiveSQL 查询无数据,String类型的字段自动转化为int类型的经历和解决方案
hive
weixin_46244623
3 天前
Hadoop / YARN / Hive 运维操作教程
运维·hive·hadoop
無森~
4 天前
Hive概述
数据仓库·hive·hadoop
無森~
4 天前
Hive下载与安装
数据仓库·hive·hadoop
热门推荐
01GitHub 镜像站点02OpenCode 入门教程:介绍 · 安装 · 配置第三方 API (如 Claude)03在VSCode配置Java开发环境的保姆级教程(适配各类AI编程IDE)04UV安装并设置国内源05Claude Code Skills 实用使用手册06BongoCat - 跨平台键盘猫动画工具07安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口(持续更新)08AI 规范驱动开发“三剑客”深度对比:Spec-Kit、Kiro 与 OpenSpec 实战指南09Linux下V2Ray安装配置指南10Open Code教程(四)| 高级配置与集成