Hive/Spark 整库导出/导入脚本

1. 整库导出为一个SQL文件

bash 复制代码
database="<your-database-name>"

cat << EOF > $database.sql
drop database if exists $database cascade;
create database if not exists $database;
use $database;
EOF

for table in $(beeline -n hadoop -u jdbc:hive2:// --showHeader=false --outputformat=tsv2 -e "use $database; show tables;"); do 
    beeline -n hadoop -u jdbc:hive2:// --showHeader=false --outputformat=tsv2 -e "show create table $database.$table;" >> $database.sql
    echo ";" >> $database.sql
done

2. 从SQL文件导入数据库

bash 复制代码
spark-sql -f /path/to/your-exported-db.sql
相关推荐
keep__go9 小时前
spark 单机安装
大数据·运维·分布式·spark
howard200515 小时前
4.2 Hive数据表操作
hive·内部表·数据表·插入记录·查询记录
BD_Marathon15 小时前
【Hive】复杂数据类型
数据仓库·hive·hadoop
蒙特卡洛的随机游走16 小时前
Spark的persist和cache
大数据·分布式·spark
蒙特卡洛的随机游走16 小时前
Spark 中 distribute by、sort by、cluster by 深度解析
大数据·分布式·spark
梦里不知身是客1116 小时前
Spark中的宽窄依赖-宽窄巷子
大数据·分布式·spark
闲人编程1 天前
Python与大数据:使用PySpark处理海量数据
大数据·开发语言·分布式·python·spark·codecapsule·大规模
q***76662 天前
Spring Boot 从 2.7.x 升级到 3.3注意事项
数据库·hive·spring boot
青云交2 天前
Java 大视界 -- 基于 Java 的大数据实时数据处理在工业互联网设备协同制造中的应用与挑战
flink·spark·工业互联网·预测性维护·实时数据处理·java 大数据·设备协同制造
q***3752 天前
Spring Boot 从 2.7.x 升级到 3.3注意事项
数据库·hive·spring boot