HDFS和HBase跨集群数据迁移 源码

HDFS集群间数据迁移(hadoop distcp)

shell 复制代码
hadoop distcp \
-pb \
hdfs://XX.14.36.205:8020/user/hive/warehouse/dp_fk_tmp.db/ph_cash_order \
hdfs://XX.18.32.21:8020/user/hive/warehouse/dp_fksx_mart.db/

HBase集群间数据(hbase ExportSnapshot)

shell 复制代码
/usr/local/fqlhadoop/hbase/bin/hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot \
-Dmapreduce.job.name=ExportSnapshot-portrait_info_fql_20241106 \
-Dmapreduce.job.queuename=lx_realtime \
-Dsnapshot.export.skip.tmp=true \
-Dmapreduce.map.memory.mb=4096 \
-Dmapreduce.map.java.opts=-Xmx3686m \
-overwrite \
-snapshot snapshot_portrait_info_fql_20241106 \
-copy-from hdfs://11.portraitszl.hbase.fql.com:8020/hbase \
-copy-to hdfs://1.compareportrait.hbase.fql.com:8020/hbase \
-mappers 150 \
-bandwidth 100
相关推荐
K_i1341 小时前
Hadoop 集群自动化运维实战
运维·hadoop·自动化
Q26433650233 小时前
【有源码】基于Python与Spark的火锅店数据可视化分析系统-基于机器学习的火锅店综合竞争力评估与可视化分析-基于用户画像聚类的火锅店市场细分与可视化研究
大数据·hadoop·python·机器学习·数据分析·spark·毕业设计
顧棟16 小时前
【Yarn实战】Yarn 2.9.1滚动升级到3.4.1调研与实践验证
hadoop·yarn
D明明就是我18 小时前
Hive 拉链表
数据仓库·hive·hadoop
嘉禾望岗5031 天前
hive join优化和数据倾斜处理
数据仓库·hive·hadoop
yumgpkpm1 天前
华为鲲鹏 Aarch64 环境下多 Oracle 数据库汇聚操作指南 CMP(类 Cloudera CDP 7.3)
大数据·hive·hadoop·elasticsearch·zookeeper·big data·cloudera
忧郁火龙果1 天前
六、Hive的基本使用
数据仓库·hive·hadoop
忧郁火龙果1 天前
五、安装配置hive
数据仓库·hive·hadoop
chad__chang2 天前
dolphinscheduler安装过程
hive·hadoop
ajax_beijing2 天前
hadoop的三副本数据冗余策略
大数据·hadoop·分布式