Hive/Spark 整库导出/导入脚本

1. 整库导出为一个SQL文件

bash 复制代码
database="<your-database-name>"

cat << EOF > $database.sql
drop database if exists $database cascade;
create database if not exists $database;
use $database;
EOF

for table in $(beeline -n hadoop -u jdbc:hive2:// --showHeader=false --outputformat=tsv2 -e "use $database; show tables;"); do 
    beeline -n hadoop -u jdbc:hive2:// --showHeader=false --outputformat=tsv2 -e "show create table $database.$table;" >> $database.sql
    echo ";" >> $database.sql
done

2. 从SQL文件导入数据库

bash 复制代码
spark-sql -f /path/to/your-exported-db.sql
相关推荐
CONTONUE1 小时前
Spark处理过程-转换算子和行动算子(一)
大数据·分布式·spark
计算机人哪有不疯的1 小时前
Hadoop的组成,HDFS架构,YARN架构概述
大数据·数据库·hadoop·spark
Freedom℡1 小时前
Spark,集群搭建-Standalone
spark
Light603 小时前
Spark在大数据ETL中的应用:数据清洗与转换实战
大数据·spark·etl·数据清洗·数据转换
MZWeiei14 小时前
Spark任务调度流程详解
大数据·分布式·spark·scala
бесплатно15 小时前
Spark-Core(RDD行动算子)
大数据·分布式·spark
静听山水20 小时前
Hive JOIN 优化策略详解
hive
Microsoft Word21 小时前
数据仓库Hive
数据仓库·hive·hadoop
IvanCodes1 天前
四、Hive DDL表定义、数据类型、SerDe 与分隔符核心
大数据·hive·hadoop
yyywoaini~1 天前
RDD有哪几种创建方式
spark