Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
一起养小猫19 分钟前
智纺云ERP开发实战
java·css·sql·spring·html
二哈喇子!21 分钟前
数据库如何建表
数据库·sql·mysql
Star Learning Python1 小时前
面试中要求“熟练掌握SQL”
sql·面试·职场和发展
山峰哥1 小时前
数据库工程实战:一招实现 SQL 查询速度 10 倍提升
android·数据库·sql·编辑器·深度优先
yumgpkpm2 小时前
Cloudera CDP/CMP华为鲲鹏版下 Spark应用加速,华为昇腾芯片的实用配置过程
hive·hadoop·elasticsearch·flink·kafka·hbase·cloudera
浊酒南街2 小时前
spark sql 中LENGTH 和 SIZE 函数介绍
sql·spark
zgl_200537792 小时前
源代码:ZGLanguage 解析SQL数据血缘 之 显示 WITH SQL 结构图
大数据·数据库·数据仓库·sql·数据治理·etl·数据血缘
m0_748252382 小时前
ervlet 编写过滤器
数据仓库·hive·hadoop
玖日大大2 小时前
IoTDB AINode:SQL驱动时序AI全流程落地
人工智能·sql·iotdb
SickeyLee2 小时前
SQL常见知识点汇总
数据库·sql·oracle