Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
0xDevNull5 分钟前
MySQL 别名(Alias)指南:从入门到避坑
java·数据库·sql
正在走向自律7 小时前
KingbaseES 基础 SQL 语法与日常运维实操手册
运维·数据库·sql·kingbasees
AKA__Zas8 小时前
初识 事务
java·开发语言·数据库·sql
xyyaihxl8 小时前
【SQL技术】不同数据库引擎 SQL 优化方案剖析
数据库·sql
℡終嚸♂6801 天前
FlowiseAI 任意文件上传 CTF Writeup
sql·web安全
与衫1 天前
[特殊字符] 解决 DataHub 无法解析复杂 SQL 血缘的问题(gsp-datahub-sidecar 实测)
数据库·sql
以神为界1 天前
数据库入门全指南:从基础概念到实操操作(含SQL+Navicat)
网络·数据库·sql·安全
Elastic 中国社区官方博客1 天前
Elasticsearch:快速近似 ES|QL - 第二部分
大数据·数据库·sql·elasticsearch·搜索引擎·全文检索
七夜zippoe1 天前
DolphinDB SQL查询:从简单到复杂
数据库·sql·mysql·查询·dolphindb
山峰哥1 天前
SQL性能飞跃:从索引策略到查询优化的全链路实战指南
数据库·sql·性能优化·深度优先