Hive/Spark 整库导出/导入脚本

1. 整库导出为一个SQL文件

bash 复制代码
database="<your-database-name>"

cat << EOF > $database.sql
drop database if exists $database cascade;
create database if not exists $database;
use $database;
EOF

for table in $(beeline -n hadoop -u jdbc:hive2:// --showHeader=false --outputformat=tsv2 -e "use $database; show tables;"); do 
    beeline -n hadoop -u jdbc:hive2:// --showHeader=false --outputformat=tsv2 -e "show create table $database.$table;" >> $database.sql
    echo ";" >> $database.sql
done

2. 从SQL文件导入数据库

bash 复制代码
spark-sql -f /path/to/your-exported-db.sql
相关推荐
yumgpkpm44 分钟前
腾讯云TBDS与CDH迁移常见问题有哪些?建议由CDH迁移到CMP 7.13 平台(类Cloudera CDP,如华为鲲鹏 ARM 版)
hive·hadoop·zookeeper·flink·spark·kafka·hbase
bigdata-rookie1 天前
Spark 部署模式
大数据·分布式·spark
yumgpkpm1 天前
数据可视化AI、BI工具,开源适配 Cloudera CMP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版)值得推荐?
人工智能·hive·hadoop·信息可视化·kafka·开源·hbase
二进制_博客1 天前
使用datax将mysql数据抽取到hive分区表无数据
数据库·hive·mysql
干就完事了1 天前
Hive视图
数据仓库·hive·hadoop
sheji34161 天前
【开题答辩全过程】以 基于Spark的药品库存可视化分析系统为例,包含答辩的问题和答案
大数据·分布式·spark
larance1 天前
spark-submit 常用方式
大数据·spark
A尘埃1 天前
Spark基于内存计算的数据处理
大数据·分布式·spark
A尘埃1 天前
Hive基于Hadoop的数据仓库工具
数据仓库·hive·hadoop
百***35942 天前
从0到1部署Tomcat和添加servlet(IDEA2024最新版详细教程)
hive·servlet·tomcat