HBase 复制、备份、迁移

一、行业分享

分享1 阿里云 BDS-HBase

《HBase高效一键迁移的设计与实践.pdf》
https://developer.aliyun.com/live/730
https://developer.aliyun.com/article/704972
https://developer.aliyun.com/article/704977
https://blog.csdn.net/u013411339/article/details/101185699

分享2 腾讯FIT



HBase金融大数据乾坤大挪移
https://www.jianshu.com/p/cb4a645dd66a

HBase跨机房迁移技术分享总结
https://www.jianshu.com/p/defc787b2704

dbaplus181期:腾讯金融HBase跨机房迁移实战
https://m.qlchat.com/topic/details?topicId=2000003847589595
https://dbaplus.cn/activity-12-755-1.html

二、HBase 集群间数据迁移


https://blog.csdn.net/qq1010885678/article/details/51971154

https://github.com/ucarGroup/DataLink/wiki/2.2_HBase-Reader

使用HBase快照实现跨集群全量与增量数据迁移
https://cloud.tencent.com/developer/article/1078173
https://cloud.tencent.com/developer/article/1078240

https://www.cnblogs.com/ballwql/p/hbase_data_transfer.html
https://blog.51cto.com/u_16099287/7532521
https://bbs.huaweicloud.com/blogs/163290

https://blog.csdn.net/qq_26442553/article/details/134282334
https://blog.csdn.net/wypblog/article/details/108030883
https://www.slideshare.net/jmhsieh/apache-hbase-for-the-enterprise-stratahadoop-world-2012

shell 复制代码
使用distcp方式迁移数据:
步骤1、使用distcp方式拷贝HDFS上的数据:
格式:
hadoop distcp ${旧集群HBase表在HDFS上路径} ${新集群HBase表在HDFS上路径}
例如:
hadoop distcp hdfs://192.168.75.156:8020/hbase/data/default/SYSTEM.STATS hdfs://192.168.75.11:8020/hbase/data/default/SYSTEM.STATS

步骤2、然后执行:
hbase hbck -fixMeta
hbase hbck -fixAssignments

即可把数据做HBase集群间迁移。

Snapshot

http://hbasefly.com/2017/09/17/hbase-snapshot/
https://hbase.apache.org/book.html#ops.snapshots

Replication

https://www.slideshare.net/cloudera/internals-session-7b

其他记录

http://blog.cloudera.com/blog/2012/06/online-hbase-backups-with-copytable-2
https://blog.cloudera.com/introduction-to-apache-hbase-snapshots/
http://blog.cloudera.com/blog/2013/06/introduction-to-apache-hbase-snapshots-part-2-deeper-dive/
https://hbase.apache.org/book.html#casestudies

相关推荐
天翼云开发者社区7 分钟前
Doris-HDFS LOAD常见问题汇总(二)
大数据·doris
小小不董9 分钟前
深入理解oracle ADG和RAC
linux·服务器·数据库·oracle·dba
简婷1870199877532 分钟前
源网荷储 + 零碳园区:一场关于能源与未来的双向奔赴
大数据·人工智能·能源
2201_7567767744 分钟前
网络安全初级
大数据·elasticsearch·搜索引擎
胚芽鞘68144 分钟前
查询依赖冲突工具maven Helper
java·数据库·maven
宇钶宇夕1 小时前
SIMATIC S7-1200的以太网通信能力:协议与资源详细解析
运维·服务器·数据库·程序人生·自动化
m0_703323671 小时前
SEO外包服务甄选指南:避开陷阱,精准匹配
大数据·人工智能
LuckyLay1 小时前
1.1.1数据类型与变量——AI教你学Django
数据库·django·sqlite
zzywxc7872 小时前
AI技术通过提示词工程(Prompt Engineering)正在深度重塑职场生态和行业格局,这种变革不仅体现在效率提升,更在重构人机协作模式。
java·大数据·开发语言·人工智能·spring·重构·prompt
张先shen2 小时前
Elasticsearch RESTful API入门:索引的增删改查完全指南
java·大数据·elasticsearch·搜索引擎·架构·全文检索·restful