Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
小韩博2 小时前
小迪笔记45课之-PHP应用&SQL二次注入&堆叠执行&DNS带外&功能点&黑白盒条件
笔记·sql·网络安全·php
默默前行的虫虫3 小时前
nicegui网页多用户数据隔离总结
数据库·sql
是阿威啊3 小时前
【第二站】本地hadoop集群配置yarn模式
大数据·linux·hadoop·yarn
山峰哥4 小时前
SQL查询优化秘籍:从Explain分析到性能飞跃
开发语言·数据库·sql·oracle·性能优化·系统优化
杨云龙UP5 小时前
Oracle释放磁盘空间:alert.log和listener.log清理实战记录_20251225
运维·服务器·数据库·sql·oracle
爱吃山竹的大肚肚5 小时前
优化SQL:如何使用 EXPLAIN
java·数据库·spring boot·sql·spring
探索宇宙真理.6 小时前
SeaCMS SQL注入漏洞 | CVE-2025-15002 复现&研究
数据库·sql·开源·海洋cms
山峰哥6 小时前
SQL性能瓶颈破局:Explain分析+实战优化全攻略
大数据·数据库·sql·oracle·性能优化
l1t6 小时前
sqlite递归查询指定搜索顺序的方法
数据库·sql·sqlite·dfs·递归·cte
爱吃山竹的大肚肚6 小时前
MySQL 支持的各类索引
java·数据库·sql·mysql·spring·spring cloud