Hadoop-HA(高可用)机制

首先:在每个NAMENODE上都会有一个zkfc(zookeeper failover colltroller) ,负责这两个的状态管理。哪个是(active和standby)然后写入zk集群里面。同时监控自己所在的机器是否正常。一旦active上zkfc的发现异常后,会告诉知另一台zkfc,另一台收到后就会用自己的进程,做一个状态的切换。然后将自己变为active,然后从qjournai集群中的edits快速同步下来。相应其他程序,同时跟新zookeeper里的换掉。

细节:如果是某一个时间点active出现假死状态。然后当standsy不知道也去注册了,就会同时出现2个active。这时就会有2个同时向edits写数据,客户端也不知道该去链接那个。(术语叫做"脑裂")。这个时候:standby就会直接发送ssh的指令(kill -9 ****)过去,直接杀这个active进程。防止发生这个问题。

还有一个问题:如果你发送了一个kill -9 然后网络卡了,没有杀掉这个进程。那这个时候就需要返回是否成功杀掉的结果反馈。如果没有及时得到成功的返回,就会再调用(用户提供的shell脚本程序)这个是用户自己定义的。放的位置业是自己配制的。(可以让active断电,断网等等)当调用成功后就会做切换。再将zk里的节点跟新掉。

要点:1.配置了2个name node

2.将edits剥离出来放到qjourna集群管理起来,但是qjourna又是依赖zk集群

3.状态管理使用zkfc,每个zkfc监控自己的服务,出问题就通知对方,

4.出现问题的脑裂解决方法,脚本运用。

相关推荐
半夏知半秋4 小时前
CentOS7下的ElasticSearch部署
大数据·服务器·后端·学习·elasticsearch·搜索引擎·全文检索
俞凡5 小时前
高性能数据模型设计
大数据
Aurora_NeAr5 小时前
大数据之路:阿里巴巴大数据实践——日志采集与数据同步
大数据·后端
泡芙萝莉酱5 小时前
世界各国和地区ICRG政治经济金融综合风险指标数据(1984-2023年)-实证数据
大数据·人工智能·深度学习·数据挖掘·数据分析·数据统计·实证数据
码字的字节6 小时前
Hadoop安全机制深度剖析:Kerberos认证与HDFS ACL细粒度权限控制
hadoop·安全·hdfs·kerberos·acl
♛暮辞6 小时前
hadoop(服务器伪分布式搭建)
服务器·hadoop·分布式
焦点问界6 小时前
Newline全场景方案闪耀2025中国智慧生活大会
大数据·人工智能
金融RPA机器人丨实在智能6 小时前
从爬虫到AI:亚马逊数据采集工具的进化与应用
大数据·人工智能·数据采集·亚马逊
云畅新视界6 小时前
从算力到智能资产:Sol long引领A I A g ent赋能设备的价值重构
大数据·人工智能
码字的字节9 小时前
深入解析Hadoop YARN架构设计:从原理到实践
hadoop·yarn