技术栈
hive优化
lzhlizihang
3 个月前
hive
·
hadoop
·
面试题
·
hive优化
Hive优化高频面试题
数据量小的hive查询,集群模式浪费资源而且执行速度慢,此时可以开启本地模式,在单台机器上执行处理任务,执行时间会缩短。
苡~
10 个月前
hive
·
hive优化
·
数据倾斜
·
hive常见异常
·
hive join
Hive SQL 开发指南(三)优化及常见异常
在大数据领域,Hive SQL 是一种常用的查询语言,用于在 Hadoop上进行数据分析和处理。为了确保代码的可读性、维护性和性能,制定一套规范化的 Hive SQL 开发规范至关重要。本文将介绍 Hive SQL 的基础知识,并提供一些规范化的开发指南,帮助您高效地编写 Hive SQL 查询。
苡~
10 个月前
hive
·
hql
·
hive优化
·
hive开发规范
·
hive开发指南
Hive SQL 开发指南(一)数据类型及函数
在大数据领域,Hive SQL 是一种常用的查询语言,用于在 Hadoop上进行数据分析和处理。为了确保代码的可读性、维护性和性能,制定一套规范化的 Hive SQL 开发规范至关重要。本文将介绍 Hive SQL 的基础知识,并提供一些规范化的开发指南,帮助您高效地编写 Hive SQL 查询。
Byyyi耀
1 年前
数据仓库
·
hive
·
hadoop
·
hive优化
Hive 优化总结
如何识别倾斜? - 若表为分区分桶表,以分区字段作为聚合条件聚合,并进行抽样。 - 若有HDFS的权限,查看分区文件夹的大小是否存在明显差异。