Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
TDengine (老段)9 小时前
TDengine 一条 SQL 从客户端到执行完成的全链路
大数据·数据库·sql·物联网·时序数据库·tdengine·涛思数据
唐青枫11 小时前
别只会写 IF:MySQL CASE WHEN 条件判断实战详解
sql·mysql
zhishijike13 小时前
全国行政区划sql(省市区)
数据库·sql·mysql
阳光九叶草LXGZXJ14 小时前
达梦数据库-学习-52-DmDrs参数介绍(Manager模块)
linux·运维·数据库·sql·学习
网管NO.115 小时前
SQL 是什么?
数据库·sql
Irene199116 小时前
(课堂笔记)hadoop 基础使用
hadoop
水火既济__16 小时前
加快hive效率
数据仓库·hive·hadoop
码上有光17 小时前
MySQL基础操作——约束(下)——期末快速复习
数据库·sql·mysql·期末快速复习
yzs871 天前
SQL Sever Pragmatic Bitmap过滤技术解析
数据库·sql
Full Stack Developme2 天前
SQL发展历史
数据库·sql