HDFS的QJM方案

Quorum Journal Manager仲裁日志管理器

介绍

  • Quorum Journal Manager(仲裁日志管理器),是Hadoop官方推荐的hdfs HA解决方案之一
  • 使用zookeeper中ZKFC来实现主备切换
  • 使用Journal Node(JN)集群来实现edits log的共享以达到数据同步的目的。

主备切换,脑裂问题解决---ZKFailoverController(zkfc)

ZK FAi咯verCON他蹂躏了人是一个zookeeper客户端。主要职责:

  • 监视和管理namenode健康状态
    ZKFC通过命令监视namenode节点及机器的健康状态
  • 维持和ZK集群联系
    如果本地namenode运行状况良好,并且ZKFC看到当前没有其他节点持有锁znode,它将自己尝试获取该锁。如果成功,则表明它"赢得了选举",并负责运行故障转移以使其本地namenode处于active状态。如果极硬呦其他节点持有锁,zkfc选举失败,则会对该节点注册监听,等待下次选举。

主备切换,脑裂问题解决-- Fencing(隔离)机制

  • 故障转移过程也就是俗称的主备角色切换的过程,切换过程中最怕的就是脑裂的发生。因此需要Fencing机制来避免,将先前的active节点隔离,然后将standby转换为active状态
  • Hadoop公共库中对外提供了两种Fenc ing实现,分别是sshfence和shellfence(却省实现)
    sshfence是通过ssh登陆目标节点上,使用命令fuser将进程杀死(通过tcp端口号定位进程pid,该方法比ips命令更准确)
    shellfence是指执行一个用户事先定义的shel命令(脚本)完成隔离

主备数据状态同步问题解决

  • Journal Node(JN)集群是轻量级分布式系统,主要用于高速读写数据,存储数据
  • 通常使用2N+1台Journal Node存储共享Edits Log(编辑日志)。----底层类似zk德分布式一致性算法
  • 任何修改操作在active NN上执行时,Journal Log进程同时也会记录edits log到至少半数以上的JN中,这时Standby NN检测到JN里面的同步log发生变化了会读取JN里面的edits log,然后重演操作记录同步到自己的目录镜像树里面

HA集群搭建

集群基础环境准备

HA集群规划

上传安装包,配置环境变量

HA集群初始化

相关推荐
咸鱼求放生3 小时前
es在Linux安装
大数据·elasticsearch·搜索引擎
人大博士的交易之路4 小时前
今日行情明日机会——20250606
大数据·数学建模·数据挖掘·数据分析·涨停回马枪
神奇侠20245 小时前
Hive SQL常见操作
hive·hadoop·sql
Leo.yuan7 小时前
数据库同步是什么意思?数据库架构有哪些?
大数据·数据库·oracle·数据分析·数据库架构
SelectDB技术团队8 小时前
从 ClickHouse、Druid、Kylin 到 Doris:网易云音乐 PB 级实时分析平台降本增效
大数据·数据仓库·clickhouse·kylin·实时分析
Web极客码9 小时前
在WordPress上添加隐私政策页面
大数据·人工智能·wordpress
Apache Flink10 小时前
Flink在B站的大规模云原生实践
大数据·云原生·flink
itachi-uchiha11 小时前
Docker部署Hive大数据组件
大数据·hive·docker
viperrrrrrrrrr712 小时前
大数据学习(131)-Hive数据分析函数总结
大数据·hive·学习
lifallen13 小时前
Flink checkpoint
java·大数据·算法·flink