hive库表占用空间大小的命令

1、查每个hive表占用的空间大小

hdfs dfs -du -h /user/hive/warehouse

2、按占用空间大小降序排列

hdfs dfs -du /user/hive/warehouse/ipms.db | sort -nr

3、查某一个分区占用空间大小(单位G)

hadoop fs -ls /user/hive/warehouse/ipms.db/dw_ft_se_nt_u_gen_h/fp_rat=6/stat_month=201709/stat_date=20170903/stat_hour=2017090323|awk -F ' ' '{print 5}'\|awk '{a+=1}END {print a/(1024*1024*1024)}'

4、查某一个表总占用空间大小(单位G)

hadoop fs -du /user/hive/warehouse/ipms.db/dw_ft_se_nt_u_gen_h|awk ' { SUM += $1 } END { print SUM/(1024*1024*1024) }'

5、统计hdfs某个表文件的数据量

hadoop fs -cat /user/hive/warehouse/ipms.db/dw_ft_se_nt_us_cl_h/fp_rat=9/stat_month=202401/stat_date=20240109/stat_hour=2024010906/* | wc -l

6、统计表的大小

hdfs dfs -du -s -h /user/hive/warehouse/ipms.db/dw_msisdn_cell_record_d

相关推荐
程序猿 董班长20 分钟前
springboot配置多数据源(mysql、hive)
hive·spring boot·mysql
XueminXu8 小时前
Hive使用Tez引擎出现OOM的解决方法
hive·oom·tez·datagrip·container·outofmemory
YF云飞10 小时前
数据仓库进化:Agent驱动数智化新范式
数据仓库·人工智能·ai
zzu123zsw15 小时前
01-Hadoop简介与生态系统
hadoop
鸿儒之观15 小时前
hadoop 框架 jar下载
大数据·hadoop·jar
2302_7995257415 小时前
【Hadoop】Hadoop集群安装中出现的问题
linux·hadoop
IT研究室18 小时前
大数据毕业设计选题推荐-基于大数据的分化型甲状腺癌复发数据可视化分析系统-Spark-Hadoop-Bigdata
大数据·hadoop·信息可视化·spark·毕业设计·源码·bigdata
计算机编程小央姐18 小时前
数据安全成焦点:基于Hadoop+Spark的信用卡诈骗分析系统实战教程
大数据·hadoop·python·spark·毕业设计·课程设计·dash
BYSJMG19 小时前
大数据毕业设计推荐:基于Spark的零售时尚精品店销售数据分析系统【Hadoop+python+spark】
大数据·hadoop·python·spark·django·课程设计
项目題供诗2 天前
Hadoop(七)
大数据·hadoop·分布式