Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
杨云龙UP5 小时前
MySQL 自动备份与覆盖恢复实战:一套脚本搞定全库/按库备份恢复
linux·运维·数据库·sql·mysql
元气满满-樱11 小时前
SQL语句***重点
数据库·sql
咨询QQ:48773927813 小时前
探索Qt下的UI皮肤生成器:多风格与编译那些事儿
hive
阿杰同学13 小时前
Hadoop 面试题及答案整理,最新面试题
大数据·hadoop·分布式
小白勇闯网安圈13 小时前
unserialize3、php_rce、Web_php_include、warmup、NewsCenter
sql·网络安全·web
思成不止于此14 小时前
【MySQL 零基础入门】DCL 核心语法全解析:用户管理与权限控制篇
数据库·笔记·sql·学习·mysql
weixin_4476719915 小时前
【MySQL从节点异常断连后的Slave_SQL_Running 处于Connecting的解决方案】
android·sql·mysql
roman_日积跬步-终至千里15 小时前
【源码分析】StarRocks TRUNCATE 语句执行流程:从 SQL 到数据清空的完整旅程
java·数据库·sql
ClouGence15 小时前
从 0 到 1 构建 TDSQL MySQL 实时同步链路
数据库·分布式·sql·mysql
Hello.Reader15 小时前
Flink SQL 的 LIMIT 子句语义、坑点与实战技巧
sql·flink·wpf