HDFS和HBase跨集群数据迁移 源码

HDFS集群间数据迁移(hadoop distcp)

shell 复制代码
hadoop distcp \
-pb \
hdfs://XX.14.36.205:8020/user/hive/warehouse/dp_fk_tmp.db/ph_cash_order \
hdfs://XX.18.32.21:8020/user/hive/warehouse/dp_fksx_mart.db/

HBase集群间数据(hbase ExportSnapshot)

shell 复制代码
/usr/local/fqlhadoop/hbase/bin/hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot \
-Dmapreduce.job.name=ExportSnapshot-portrait_info_fql_20241106 \
-Dmapreduce.job.queuename=lx_realtime \
-Dsnapshot.export.skip.tmp=true \
-Dmapreduce.map.memory.mb=4096 \
-Dmapreduce.map.java.opts=-Xmx3686m \
-overwrite \
-snapshot snapshot_portrait_info_fql_20241106 \
-copy-from hdfs://11.portraitszl.hbase.fql.com:8020/hbase \
-copy-to hdfs://1.compareportrait.hbase.fql.com:8020/hbase \
-mappers 150 \
-bandwidth 100
相关推荐
那一抹阳光多灿烂14 小时前
Spark核心组件解析:Executor、RDD与缓存优化
hadoop·spark
Yz987616 小时前
Hive分桶超详细!!!
大数据·数据仓库·hive·hadoop·hdfs·数据库开发·big data
Francek Chen16 小时前
【大数据技术基础 | 实验十一】Hive实验:新建Hive表
大数据·数据仓库·hive·hadoop·分布式
出发行进17 小时前
Flink错误:一historyserver无法启动,二存在的文件会报错没有那个文件或目录
大数据·linux·hadoop·flink·虚拟机
闲人编程18 小时前
Hadoop 使用过程中 15 个常见问题的详细描述、解决方案
大数据·hadoop·eclipse·解决方案·yarn·配置文件
橘子海全栈攻城狮19 小时前
【源码+文档+调试讲解】基于Hadoop实现的豆瓣电子图书推荐系统的设计与实现
大数据·数据库·hadoop·spring boot·分布式·后端
二进制_博客20 小时前
hadoop集群搭建
java·大数据·hadoop
qq_q9922502771 天前
django基于Hadoop 的国产电影数据分析与可视化
hadoop·数据分析·django
哇咔咔哇咔1 天前
Hive基础笔记
hive·hadoop·笔记
march of Time2 天前
hbase mongodb hive starrocks比较
hive·mongodb·hbase