Hive/Spark 整库导出/导入脚本

1. 整库导出为一个SQL文件

bash 复制代码
database="<your-database-name>"

cat << EOF > $database.sql
drop database if exists $database cascade;
create database if not exists $database;
use $database;
EOF

for table in $(beeline -n hadoop -u jdbc:hive2:// --showHeader=false --outputformat=tsv2 -e "use $database; show tables;"); do 
    beeline -n hadoop -u jdbc:hive2:// --showHeader=false --outputformat=tsv2 -e "show create table $database.$table;" >> $database.sql
    echo ";" >> $database.sql
done

2. 从SQL文件导入数据库

bash 复制代码
spark-sql -f /path/to/your-exported-db.sql
相关推荐
goTsHgo1 小时前
在 Spark 上实现 Graph Embedding
大数据·spark·embedding
程序猿小柒1 小时前
【Spark】Spark SQL执行计划-精简版
大数据·sql·spark
隔着天花板看星星1 小时前
Spark-Streaming集成Kafka
大数据·分布式·中间件·spark·kafka
神秘打工猴7 小时前
hive常用函数有哪些
hive
lucky_syq21 小时前
Hive与HBase的区别有哪些
hive·hadoop·hbase
出发行进1 天前
Hive其五,使用技巧,数据查询,日志以及复杂类型的使用
大数据·hive·数据分析
武子康1 天前
大数据-256 离线数仓 - Atlas 数据仓库元数据管理 正式安装 启动服务访问 Hive血缘关系导入
大数据·数据仓库·hive·hadoop
lucky_syq1 天前
Spark和Hive的区别
大数据·hive·spark
小刘鸭!2 天前
Hive解决数据倾斜
数据仓库·hive·hadoop
隔着天花板看星星2 天前
Spark-Streaming receiver模式源码解析
大数据·分布式·spark