技术栈

hive优化

lzhlizihang
8 个月前
hive·hadoop·面试题·hive优化
Hive优化高频面试题数据量小的hive查询,集群模式浪费资源而且执行速度慢,此时可以开启本地模式,在单台机器上执行处理任务,执行时间会缩短。
苡~
1 年前
hive·hive优化·数据倾斜·hive常见异常·hive join
Hive SQL 开发指南(三)优化及常见异常在大数据领域,Hive SQL 是一种常用的查询语言,用于在 Hadoop上进行数据分析和处理。为了确保代码的可读性、维护性和性能,制定一套规范化的 Hive SQL 开发规范至关重要。本文将介绍 Hive SQL 的基础知识,并提供一些规范化的开发指南,帮助您高效地编写 Hive SQL 查询。
苡~
1 年前
hive·hql·hive优化·hive开发规范·hive开发指南
Hive SQL 开发指南(一)数据类型及函数在大数据领域,Hive SQL 是一种常用的查询语言,用于在 Hadoop上进行数据分析和处理。为了确保代码的可读性、维护性和性能,制定一套规范化的 Hive SQL 开发规范至关重要。本文将介绍 Hive SQL 的基础知识,并提供一些规范化的开发指南,帮助您高效地编写 Hive SQL 查询。
Byyyi耀
1 年前
数据仓库·hive·hadoop·hive优化
Hive 优化总结如何识别倾斜? - 若表为分区分桶表,以分区字段作为聚合条件聚合,并进行抽样。 - 若有HDFS的权限,查看分区文件夹的大小是否存在明显差异。