HBase 复制、备份、迁移

一、行业分享

分享1 阿里云 BDS-HBase

《HBase高效一键迁移的设计与实践.pdf》
https://developer.aliyun.com/live/730
https://developer.aliyun.com/article/704972
https://developer.aliyun.com/article/704977
https://blog.csdn.net/u013411339/article/details/101185699

分享2 腾讯FIT



HBase金融大数据乾坤大挪移
https://www.jianshu.com/p/cb4a645dd66a

HBase跨机房迁移技术分享总结
https://www.jianshu.com/p/defc787b2704

dbaplus181期:腾讯金融HBase跨机房迁移实战
https://m.qlchat.com/topic/details?topicId=2000003847589595
https://dbaplus.cn/activity-12-755-1.html

二、HBase 集群间数据迁移


https://blog.csdn.net/qq1010885678/article/details/51971154

https://github.com/ucarGroup/DataLink/wiki/2.2_HBase-Reader

使用HBase快照实现跨集群全量与增量数据迁移
https://cloud.tencent.com/developer/article/1078173
https://cloud.tencent.com/developer/article/1078240

https://www.cnblogs.com/ballwql/p/hbase_data_transfer.html
https://blog.51cto.com/u_16099287/7532521
https://bbs.huaweicloud.com/blogs/163290

https://blog.csdn.net/qq_26442553/article/details/134282334
https://blog.csdn.net/wypblog/article/details/108030883
https://www.slideshare.net/jmhsieh/apache-hbase-for-the-enterprise-stratahadoop-world-2012

shell 复制代码
使用distcp方式迁移数据:
步骤1、使用distcp方式拷贝HDFS上的数据:
格式:
hadoop distcp ${旧集群HBase表在HDFS上路径} ${新集群HBase表在HDFS上路径}
例如:
hadoop distcp hdfs://192.168.75.156:8020/hbase/data/default/SYSTEM.STATS hdfs://192.168.75.11:8020/hbase/data/default/SYSTEM.STATS

步骤2、然后执行:
hbase hbck -fixMeta
hbase hbck -fixAssignments

即可把数据做HBase集群间迁移。

Snapshot

http://hbasefly.com/2017/09/17/hbase-snapshot/
https://hbase.apache.org/book.html#ops.snapshots

Replication

https://www.slideshare.net/cloudera/internals-session-7b

其他记录

http://blog.cloudera.com/blog/2012/06/online-hbase-backups-with-copytable-2
https://blog.cloudera.com/introduction-to-apache-hbase-snapshots/
http://blog.cloudera.com/blog/2013/06/introduction-to-apache-hbase-snapshots-part-2-deeper-dive/
https://hbase.apache.org/book.html#casestudies

相关推荐
NocoBase35 分钟前
10 个开源工具,快速构建数据应用
数据库·低代码·开源
麻辣清汤1 小时前
结合BI多维度异常分析(日期-> 商家/渠道->日期(商家/渠道))
数据库·python·sql·finebi
Kan先生3 小时前
对象存储解决方案:MinIO 的架构与代码实战
数据库·python
拓端研究室3 小时前
专题:2025全球消费趋势与中国市场洞察报告|附300+份报告PDF、原数据表汇总下载
大数据·信息可视化·pdf
超级迅猛龙3 小时前
保姆级Debezium抽取SQL Server同步kafka
数据库·hadoop·mysql·sqlserver·kafka·linq·cdc
杨过过儿3 小时前
【Task02】:四步构建简单rag(第一章3节)
android·java·数据库
····懂···4 小时前
攻克PostgreSQL专家认证
数据库·postgresql
每天都在想吃啥4 小时前
day31 SQLITE
数据库·sqlite
阿里云大数据AI技术4 小时前
MaxCompute聚簇优化推荐功能发布,单日节省2PB Shuffle、7000+CU!
大数据