Hadoop集群时间同步方法

本文基于Lniux的Ubuntu发行版对Hadoop集群时间进行同步操作。

首先我们得了解什么是NTP服务:

NTP(Network Time Protocol,网络时间协议)是用于同步计算机时间的网络协议,核心作用:

  1. 解决分布式集群中「节点时间不一致」的问题 ------Hadoop 集群的任务调度、日志记录、数据同步等依赖统一时间戳,时间偏差会导致任务失败、数据错乱;
  2. 工作原理:指定一台机器(hadoop102)作为「时间服务器」,其他节点定期(如每 10 分钟)向它发送请求,校准自身系统时间,确保整个集群时间统一;

所以我们得先在机器中安装NTP服务:

复制代码
# 更新软件包列表(可选,确保安装最新版本)
sudo apt update

# 安装NTP服务(对应CentOS的yum install -y ntp)
sudo apt install -y ntp

# 验证安装成功(查看服务状态)
sudo systemctl status ntp

具体配置分配,这里以三台机器102、103、104为例:

  1. hadoop102(时间服务器):安装 NTP 服务并配置为「时间主节点」,提供集群内统一时间源;
  2. hadoop103/hadoop104(普通节点) :也需安装 NTP 相关组件(实际安装 ntp 包后,会包含 ntpdate 工具),用于执行定时同步命令(ntpdate hadoop102)。
  1. 编辑配置文件:

    复制代码
    sudo vim /etc/ntp.conf
  2. 关键配置修改(按文档要求调整):

  • 授权集群网段同步 :找到 #restrict 192.168.1.0 mask 255.255.255.0 nomodify notrap,删除开头 # 注释(允许 192.168.1.0/24 网段节点同步)。
  • 禁用外网时间服务器 :给以下 4 行添加 # 注释(集群仅依赖本地时间服务器):
    *

    复制代码
      #server 0.ubuntu.pool.ntp.org iburst
      #server 1.ubuntu.pool.ntp.org iburst
      #server 2.ubuntu.pool.ntp.org iburst
      #server 3.ubuntu.pool.ntp.org iburst

或者是任何pool开头的

  • 添加本地时间源 :在文件末尾添加(断网时仍可提供时间):

    复制代码
    server 127.127.1.0  # 本地时间源
    fudge 127.127.1.0 stratum 10  # 时间层级(避免对外提供服务)
  • 保存退出(:wq),重启 NTP 服务:

    sudo systemctl restart ntp
    sudo systemctl enable ntp # 开机自启

二、hadoop103/hadoop104(普通节点):指向时间服务器同步

核心目标:不对外提供服务,仅定期从 hadoop102 同步时间。

  1. 编辑配置文件:

    复制代码
    sudo vim /etc/ntp.conf
  2. 关键配置修改:删除 / 注释所有外网时间服务器 :同 hadoop102,注释掉 0.ubuntu.pool.ntp.org 等 4 行。

  • 添加时间服务器(hadoop102) :在文件末尾添加(优先同步 hadoop102 时间):

    复制代码
    server hadoop102 iburst  # 指向集群时间服务器,iburst 加速同步
    server 127.127.1.0  # 兜底:若 hadoop102 不可用,用本地时间
    fudge 127.127.1.0 stratum 10
  1. 禁用自身作为时间服务器 :确保文件中无 restrict 授权其他网段的配置(仅保留默认的本地限制即可)。
  • 保存退出,关闭 NTP 服务(普通节点无需运行 ntpd 守护进程,依赖 ntpdate 定时同步):

    复制代码
    sudo systemctl stop ntp
    sudo systemctl disable ntp  # 禁止开机自启,避免冲突

清除 NTP 缓存并重启服务

复制代码
# 停止 NTP 服务
sudo systemctl stop ntp
# 清除外网同步缓存(关键:避免残留连接)
sudo rm -rf /var/lib/ntp/ntp.drift /var/lib/ntp/peers.cache
# 重启 NTP 服务
sudo systemctl start ntp
# 验证配置是否生效
sudo ntpq -p
理想输出:remote 列仅保留 LOCAL(0)(本地时间源),所有外网节点消失或 reach 列变为 0。

三、验证

在102端口输入:

复制代码
sudo netstat -tuln | grep 123

输出:

即为正常,123 是 NTP(Network Time Protocol,网络时间协议)的默认端口,专门用于计算机之间的时间同步通信。

模拟偏差:

在 hadoop103 手动修改时间(模拟时间偏差):

复制代码
sudo date -s "2025-01-01 10:00:00"

等待 10 分钟手动触发同步:

复制代码
sudo ntpdate hadoop102
相关推荐
云老大TG:@yunlaoda3608 小时前
华为云国际站代理商TaurusDB的成本优化体现在哪些方面?
大数据·网络·数据库·华为云
面向Google编程9 小时前
Flink源码阅读:窗口
大数据·flink
老蒋新思维9 小时前
知识IP的长期主义:当AI成为跨越增长曲线的“第二曲线引擎”|创客匠人
大数据·人工智能·tcp/ip·机器学习·创始人ip·创客匠人·知识变现
乐迪信息10 小时前
乐迪信息:煤矿皮带区域安全管控:人员违规闯入智能识别
大数据·运维·人工智能·物联网·安全
悟能不能悟11 小时前
springboot全局异常
大数据·hive·spring boot
hans汉斯11 小时前
嵌入式操作系统技术发展趋势
大数据·数据库·物联网·rust·云计算·嵌入式实时数据库·汉斯出版社
产品设计大观11 小时前
6个宠物APP原型设计案例拆解:含AI问诊、商城、领养、托运
大数据·人工智能·ai·宠物·墨刀·app原型·宠物app
liliangcsdn13 小时前
LLM MoE 形式化探索
大数据·人工智能
天远云服14 小时前
Go 语言高并发实战:批量清洗天远借贷行为验证API (JRZQ8203) 的时间序列数据
大数据·api
Hello.Reader14 小时前
Flink 系统内置函数(Built-in Functions)分类、典型用法与选型建议
大数据·flink·excel