Shell 获取Hive表的location 信息

用shell 获取建表语句:

bash 复制代码
hive -e "show create table ods_job.ods_job_tb"

得到结果:

bash 复制代码
CREATE TABLE `ods_job.ods_job_tb`(
  `id` bigint COMMENT 'id', 
  `auto` int COMMENT 'job开启/关闭:0-关闭;1-开启', 
 ....
  `timeout_kill` string COMMENT '是否超时kill')
COMMENT 'job表'
PARTITIONED BY ( 
  `d` string COMMENT '日期分区字段')
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.serde2.columnar.ColumnarSerDe' 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.RCFileInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.RCFileOutputFormat'
LOCATION
  'hdfs://ns/user/hive/warehouse/job.db/job_tb'
TBLPROPERTIES (
  'last_modified_by'='user', 
  'last_modified_time'='1656303639', 
  'metadata.partition.life'='-1', 
  'metadata.security.level'='Medium', 
  'orc.bloom.filter.columns'='id,visitor_id,auto,owner,group_id', 
  'spark.sql.partitionProvider'='catalog', 
  'transient_lastDdlTime'='1706259083')
Time taken: 1.343 seconds, Fetched: 57 row(s)

想要获取LOCATION 引号里面的值,并实现自动化

bash 复制代码
tardb=$1
tarTblname=$2
stmt=`hive-sql -v -e "use ${tardb}; show create table ${tarTblname};"`
loc=$( expr "${stmt}" : ".*LOCATION...'\([^']*\)" );

echo $loc

方式2, 这种会有点瑕疵,一旦表中有location 字段就有可能会产生bug,而上面就不会出现这种问题

bash 复制代码
#!/bin/bash

# 替换为你的 Hive 表名
table_name="db.table"

# 使用 Hive 命令获取表的详细信息,并通过 grep 筛选出包含 "Location" 的行
location_info=$(hive -e "describe formatted $table_name" | grep "Location")

# 提取出具体的 location 值
location=$(echo $location_info | awk '{print $2}')

echo "表 $table_name 的 location 信息为: $location"

loc变量就是想要的结果,这个shell稍微难写一点的就是里面的正则,还得过滤掉引号。

小记~

相关推荐
The Sheep 20238 小时前
WPF自定义路由事件
大数据·hadoop·wpf
还是大剑师兰特17 小时前
Hadoop面试题及详细答案 110题 (86-95)-- Hadoop生态系统工具
hadoop·大剑师·hadoop面试题
yumgpkpm17 小时前
CMP (类Cloudera) CDP7.3(400次编译)在华为鲲鹏Aarch64(ARM)信创环境中的性能测试过程及命令
大数据·hive·hadoop·python·elasticsearch·spark·cloudera
Q264336502318 小时前
大数据实战项目-基于K-Means算法与Spark的豆瓣读书数据分析与可视化系统-基于python的豆瓣读书数据分析与可视化大屏
大数据·hadoop·机器学习·数据分析·spark·毕业设计·kmeans
vortex519 小时前
Shell脚本技巧:去除文件中字符串两端空白
linux·bash·shell·sed·awk
大数据CLUB20 小时前
基于spark的抖音短视频数据分析及可视化
大数据·hadoop·分布式·数据分析·spark
yumgpkpm20 小时前
大数据综合管理平台(CMP)(类Cloudera CDP7.3)有哪些核心功能?
hive·hadoop·elasticsearch·zookeeper·big data
板凳坐着晒太阳20 小时前
Hive 删除分区语句卡死问题
数据仓库·hive·hadoop
Q26433650231 天前
【有源码】基于Hadoop生态的大数据共享单车数据分析与可视化平台-基于Python与大数据的共享单车多维度数据分析可视化系统
大数据·hadoop·python·机器学习·数据分析·spark·毕业设计
计算机毕业设计木哥1 天前
计算机毕设选题推荐:基于Hadoop和Python的游戏销售大数据可视化分析系统
大数据·开发语言·hadoop·python·信息可视化·spark·课程设计