云存储技术:HBase & HDFS 无感知迁移方案

在大数据生态系统中,HBase 和 HDFS 是两个关键组件。HBase 是一个分布式列式数据库,常用于实时读写大规模数据;HDFS 是一个高可靠的分布式文件系统,用于存储海量数据。

1、背景

随着业务的发展和技术的进步,可能需要对现有的HBase/Hadoop集群进行迁移,或是因为各种原因(如成本控制、硬件升级、地理位置调整等)进行机房搬迁。这样的操作不仅涉及到大量的技术细节,还需要考虑业务连续性和数据一致性等关键因素。

2、重难点

在集群迁移过程中,为了避免HDFS NameNode的单点故障 风险,并增强系统的高可用性和容错能力,HDFS需要采用**多NameNode(MultiNN)**架构。在这一架构下,至少需要三个及以上的NameNode节点来确保在替换和迁移过程中,能够无缝地进行NameNode的切换和迁移,从而实现服务的不间断运行。

3、涉及迁移的角色

公共服务

  1. ZooKeeper:5台

HBASE

  1. HMaster:1台

  2. HRegion Server:n台

  3. HBase thrift-Server:n台

HDFS

  1. NameNode【重点】:2台HA

  2. JN:5台

  3. DFS-Router:2台

  4. ZKFC:2台

4、迁移流程

step1: 扩容ZK

预备知识:

  1. zk节点dead过半后,如果leader down掉,将无法选主

  2. zk集群如果无法选主,HBase集群服务将彻底挂掉

  3. 如果zk只剩下leader存活,其他follower全部宕机,hbase服务正常

扩容步骤:

  1. 扩容新集群的7台zk到原zk集群

说明:采取5台old+7台new方式进行扩容,因为如果5+5扩容,双数10台实际效果等于9台,扩容完毕后,再次缩容的时候就有风险了,因为dead过半了 一旦leader挂了就没法选主了。扩成成5+7后,这样就算第二轮关闭原来5台节点,新leader挂了也可以容错选主;主要操作成本在于让hbase识别扩容后的zk集群,需要重启生效。

step 2: JournalNode扩容

扩容步骤(扩入新集群的5台JN):

  1. 修改配置文件:在所有 NameNode(包括 nn1nn2)以及所有 JournalNode 上编辑 hdfs-site.xml 配置文件,以新增的 JournalNode 配置信息。

  2. 依次重启 JournalNode:逐一重启每一个 JournalNode 实例,确保在重启下一个 JournalNode 之前,当前重启的 JournalNode 已经处于稳定状态。

  3. 重启 NameNode 并切换角色:首先重启处于 Standby 模式的 NameNode,随后通过操作命令进行主备切换,之后再重启另一个 NameNode,以此来确保新的 JournalNode 配置被主 NameNode 所识别并使用。

说明:为保证JounalNode的高可用,需要先扩容后再缩容,避免单点风险(3台old+5台new 类似于上述zk)。

step 3: 迁移NN主节点

预备知识:机房搬迁/集群迁移,只要是涉及到换HDFS主节点,就不可避免的会带来单点风险,为了保证底层存储服务的稳定性,数据的一致性,必须随时保证有两个及以上的主节点可以正常提供服务,需要新增多NN(一主多备)的功能。

扩容步骤:

  1. 修改HA配置,添加在新集群上的Standby节点

  2. 拷贝老standby节点的fsimage editlog到新节点对应目录(整个namenode目录)

  3. 将三个节点的相关配置更新到所有的DataNode节点上,并refresh使配置生效

  4. 观察所有DataNode节点是否能成功汇报至新增Standby节点,fsimage是否能从两个Standby节点向Active节点成功更新

  5. 重复上述步骤,将所有NameNode都更新为新集群的节点,完成HDFS主节点的迁移

说明:通过上述步骤将可用NameNode个数随时保证在2个及以上,避免单点风险。

step 4: 迁移DN数据节点

迁移步骤:

  1. 扩容新集群的DN节点到该集群

  2. 采用decommission将老集群的DN节点逐步下掉(数据自动挪到新机器上)

说明:Decommission占用DN自身的带宽进行数据的迁移,不占用额外的计算资源。

step 5: RegionServer滚动重启

重启步骤:(换机器灰度重启)

  1. 新机器上新增hadoop客户端相关的HA配置(有router的话,可以配置router地址进行解析)

  2. 新机器上修改扩容后zk相关配置

  3. 逐步启动新机器的RS服务,观察服务是否能正常稳定运行

  4. 逐步停掉老机器的服务,并观察服务是否正常,若出现问题,立刻回滚

step 6: 替换HBase Master节点

预备知识:HBase Master负责一些周期性的清理工作,负载均衡,元数据操作;短时间无法提供服务是不会影响线上的请求的。

替换步骤:

  1. 新机器上新增hadoop客户端相关的HA配置(有router的话,可以配置router地址进行解析),并修改扩容后zk相关配置

  2. 停老机器上的Master服务

  3. 启动新机器的Master服务

  4. 观察服务是否正常,若出现问题,立刻回滚

step 7: zk缩容

缩容后只留下5台新集群的zk节点,并修改NameNode,DataNode,HMaster,RegionServer服务上的相关配置。

step 8: JournalNode缩容

缩容后只留下5台新集群的JN节点,并修改NameNode上相关的配置。

step 9: RegionServer滚动重启

滚动重启步骤:

  1. 依次将rs上的region无缝分配到其他机器,将rs挪到其他RSGroup中,业务几乎无感知

    go 复制代码
    move_servers_rsgroup 'dest',['server1:port']
  2. 待rs上所有region都分配到其他机器上,可以重启机器,使新配置生效

  3. 最后将重启完的rs挪回原来的RSGroup,集群负载均衡后,即可正常提供服务

step 10: 重启所有NameNode节点并切换主备
升级遇到可优化问题
1. refresh node for DN

(1)执行refresh node,对于老的ns,是否应该区别对待,只向新建立ns进行汇报,减少汇报开销

(2)执行refresh node生效标志,目前是异步非阻塞执行,判断成功标志成本很高,是否应该做成同步阻塞执行

关键DN日志标志着命令生效:

  • refresh命令生效:Refresh request received for nameservices

  • 开始为某台NN提供Block pool服务:starting to offer service

  • 开始与NN挥手建联:beginning handshake with NN

标志着子流程阶段性成功:

  • 成功注册到NN:successfully registered with NN

标志着refresh导致DN异常

  • 根本性配置错误:Invalid host name: local host is: (unknown); destination host is

  • 根本性配置错误:Namenode for *** remains unresolved for ID null

  • 【重点校验】偶发性错误,初始化注册block pool失败:Initialization failed for Block pool <registering>

2. 部分命令失效

前提:hdfs://xxxxx域名解析到router的lvs

(1)fsck失败,因为fsck访问hdfs://xxxxx:50070端口转向NN的web port,需要lvs上加上web端口解析

(2)升级后getReplicatedBlockStats方法不生效的原因是该方法走了hdfs://xxxxx域名,但是我们把他做成了router域名,在router实现上该方法没有支持, 所以暂时无法使用 ~/software/hadoop/bin/hdfs dfsadmin -report -live

解决办法:HDFS-14714. RBF: implement getReplicatedBlockStats interface. Contributed by Chen Zhang.

(3)同上,balance也无法工作:org.apache.hadoop.ipc.RemoteException(java.lang.UnsupportedOperationException): Operation "isUpgradeFinalized" is not supported

(4)balance执行中方法解析uri中"_"是非法的导致无法启动

properties 复制代码
2024-05-30 02:00:46,832 ERROR org.apache.hadoop.hdfs.server.balancer.Balancer: Exiting balancer due an exception
java.lang.IllegalArgumentException: Illegal character in hostname at index 10: hdfs://xxxxx
        at org.apache.hadoop.hdfs.DFSUtil.createUri(DFSUtil.java:1232)
        at org.apache.hadoop.hdfs.DFSUtil.getNameServiceUris(DFSUtil.java:820)
        at org.apache.hadoop.hdfs.DFSUtil.getInternalNsRpcUris(DFSUtil.java:791)
        at org.apache.hadoop.hdfs.server.balancer.Balancer$Cli.run(Balancer.java:820)
        at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:76)
        at org.apache.hadoop.hdfs.server.balancer.Balancer.main(Balancer.java:968)
        
备注:要留意hadoop-work-balancer-***.out中的日志

更多产品和技术文章,敬请关注👆

360智汇云是以"汇聚数据价值,助力智能未来"为目标的企业应用开放服务平台,融合360丰富的产品、技术力量,为客户提供平台服务。

目前,智汇云提供数据库、中间件、存储、大数据、人工智能、计算、网络、视联物联与通信等多种产品服务以及一站式解决方案,助力客户降本增效,累计服务业务1000+。

智汇云致力于为各行各业的业务及应用提供强有力的产品、技术服务,帮助企业和业务实现更大的商业价值。

官网:https://zyun.360.cn

客服电话:4000052360

相关推荐
高兴就好(石2 小时前
DB-GPT部署和试用
数据库·gpt
这孩子叫逆2 小时前
6. 什么是MySQL的事务?如何在Java中使用Connection接口管理事务?
数据库·mysql
Karoku0663 小时前
【网站架构部署与优化】web服务与http协议
linux·运维·服务器·数据库·http·架构
懒洋洋的华3693 小时前
消息队列-Kafka(概念篇)
分布式·中间件·kafka
码农郁郁久居人下3 小时前
Redis的配置与优化
数据库·redis·缓存
March€3 小时前
分布式事务的基本实现
分布式
MuseLss4 小时前
Mycat搭建分库分表
数据库·mycat
Hsu_kk4 小时前
Redis 主从复制配置教程
数据库·redis·缓存
DieSnowK5 小时前
[Redis][环境配置]详细讲解
数据库·redis·分布式·缓存·环境配置·新手向·详细讲解
程序猿小D5 小时前
第二百三十五节 JPA教程 - JPA Lob列示例
java·数据库·windows·oracle·jdk·jpa