Hive/Spark 整库导出/导入脚本

1. 整库导出为一个SQL文件

bash 复制代码
database="<your-database-name>"

cat << EOF > $database.sql
drop database if exists $database cascade;
create database if not exists $database;
use $database;
EOF

for table in $(beeline -n hadoop -u jdbc:hive2:// --showHeader=false --outputformat=tsv2 -e "use $database; show tables;"); do 
    beeline -n hadoop -u jdbc:hive2:// --showHeader=false --outputformat=tsv2 -e "show create table $database.$table;" >> $database.sql
    echo ";" >> $database.sql
done

2. 从SQL文件导入数据库

bash 复制代码
spark-sql -f /path/to/your-exported-db.sql
相关推荐
starfalling10247 小时前
【hive】一种高效增量表的实现
hive
D明明就是我11 小时前
Hive 拉链表
数据仓库·hive·hadoop
蒙特卡洛的随机游走12 小时前
Spark核心数据(RDD、DataFrame 和 Dataset)
大数据·分布式·spark
蒙特卡洛的随机游走14 小时前
Spark的宽依赖与窄依赖
大数据·前端·spark
嘉禾望岗50315 小时前
hive join优化和数据倾斜处理
数据仓库·hive·hadoop
yumgpkpm15 小时前
华为鲲鹏 Aarch64 环境下多 Oracle 数据库汇聚操作指南 CMP(类 Cloudera CDP 7.3)
大数据·hive·hadoop·elasticsearch·zookeeper·big data·cloudera
Lansonli15 小时前
大数据Spark(六十九):Transformation转换算子intersection和subtract使用案例
大数据·分布式·spark
忧郁火龙果16 小时前
六、Hive的基本使用
数据仓库·hive·hadoop
忧郁火龙果17 小时前
五、安装配置hive
数据仓库·hive·hadoop
励志成为糕手20 小时前
宽依赖的代价:Spark 与 MapReduce Shuffle 的数据重分布对比
大数据·spark·mapreduce·分布式计算·sortshuffle