Hadoop集群时间同步方法

本文基于Lniux的Ubuntu发行版对Hadoop集群时间进行同步操作。

首先我们得了解什么是NTP服务:

NTP(Network Time Protocol,网络时间协议)是用于同步计算机时间的网络协议,核心作用:

  1. 解决分布式集群中「节点时间不一致」的问题 ------Hadoop 集群的任务调度、日志记录、数据同步等依赖统一时间戳,时间偏差会导致任务失败、数据错乱;
  2. 工作原理:指定一台机器(hadoop102)作为「时间服务器」,其他节点定期(如每 10 分钟)向它发送请求,校准自身系统时间,确保整个集群时间统一;

所以我们得先在机器中安装NTP服务:

复制代码
# 更新软件包列表(可选,确保安装最新版本)
sudo apt update

# 安装NTP服务(对应CentOS的yum install -y ntp)
sudo apt install -y ntp

# 验证安装成功(查看服务状态)
sudo systemctl status ntp

具体配置分配,这里以三台机器102、103、104为例:

  1. hadoop102(时间服务器):安装 NTP 服务并配置为「时间主节点」,提供集群内统一时间源;
  2. hadoop103/hadoop104(普通节点) :也需安装 NTP 相关组件(实际安装 ntp 包后,会包含 ntpdate 工具),用于执行定时同步命令(ntpdate hadoop102)。
  1. 编辑配置文件:

    复制代码
    sudo vim /etc/ntp.conf
  2. 关键配置修改(按文档要求调整):

  • 授权集群网段同步 :找到 #restrict 192.168.1.0 mask 255.255.255.0 nomodify notrap,删除开头 # 注释(允许 192.168.1.0/24 网段节点同步)。
  • 禁用外网时间服务器 :给以下 4 行添加 # 注释(集群仅依赖本地时间服务器):
    *

    复制代码
      #server 0.ubuntu.pool.ntp.org iburst
      #server 1.ubuntu.pool.ntp.org iburst
      #server 2.ubuntu.pool.ntp.org iburst
      #server 3.ubuntu.pool.ntp.org iburst

或者是任何pool开头的

  • 添加本地时间源 :在文件末尾添加(断网时仍可提供时间):

    复制代码
    server 127.127.1.0  # 本地时间源
    fudge 127.127.1.0 stratum 10  # 时间层级(避免对外提供服务)
  • 保存退出(:wq),重启 NTP 服务:

    sudo systemctl restart ntp
    sudo systemctl enable ntp # 开机自启

二、hadoop103/hadoop104(普通节点):指向时间服务器同步

核心目标:不对外提供服务,仅定期从 hadoop102 同步时间。

  1. 编辑配置文件:

    复制代码
    sudo vim /etc/ntp.conf
  2. 关键配置修改:删除 / 注释所有外网时间服务器 :同 hadoop102,注释掉 0.ubuntu.pool.ntp.org 等 4 行。

  • 添加时间服务器(hadoop102) :在文件末尾添加(优先同步 hadoop102 时间):

    复制代码
    server hadoop102 iburst  # 指向集群时间服务器,iburst 加速同步
    server 127.127.1.0  # 兜底:若 hadoop102 不可用,用本地时间
    fudge 127.127.1.0 stratum 10
  1. 禁用自身作为时间服务器 :确保文件中无 restrict 授权其他网段的配置(仅保留默认的本地限制即可)。
  • 保存退出,关闭 NTP 服务(普通节点无需运行 ntpd 守护进程,依赖 ntpdate 定时同步):

    复制代码
    sudo systemctl stop ntp
    sudo systemctl disable ntp  # 禁止开机自启,避免冲突

清除 NTP 缓存并重启服务

复制代码
# 停止 NTP 服务
sudo systemctl stop ntp
# 清除外网同步缓存(关键:避免残留连接)
sudo rm -rf /var/lib/ntp/ntp.drift /var/lib/ntp/peers.cache
# 重启 NTP 服务
sudo systemctl start ntp
# 验证配置是否生效
sudo ntpq -p
理想输出:remote 列仅保留 LOCAL(0)(本地时间源),所有外网节点消失或 reach 列变为 0。

三、验证

在102端口输入:

复制代码
sudo netstat -tuln | grep 123

输出:

即为正常,123 是 NTP(Network Time Protocol,网络时间协议)的默认端口,专门用于计算机之间的时间同步通信。

模拟偏差:

在 hadoop103 手动修改时间(模拟时间偏差):

复制代码
sudo date -s "2025-01-01 10:00:00"

等待 10 分钟手动触发同步:

复制代码
sudo ntpdate hadoop102
相关推荐
非著名架构师1 小时前
城市通风廊道的科学依据:气候大数据如何指导未来城市规划设计
大数据·风光功率预测·高精度气象数据
搞科研的小刘选手1 小时前
【经管专题会议】第五届大数据经济与数字化管理国际学术会议(BDEDM 2026)
大数据·区块链·学术会议·数据化管理·经济理论
蓝耘智算1 小时前
GPU算力租赁与算力云平台选型指南:从需求匹配到成本优化的实战思路
大数据·人工智能·ai·gpu算力·蓝耘
liliangcsdn1 小时前
如何用bootstrap模拟估计pass@k
大数据·人工智能·bootstrap
DMD1682 小时前
AI赋能旅游与酒店业:技术逻辑与开发实践解析
大数据·人工智能·信息可视化·重构·旅游·产业升级
Elastic 中国社区官方博客3 小时前
Elasticsearch 中使用 NVIDIA cuVS 实现最高快 12 倍的向量索引速度:GPU 加速第 2 章
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·数据库架构
jqpwxt3 小时前
启点智慧景区多商户分账系统,多业态景区收银管理系统
大数据·旅游
jkyy20143 小时前
线上线下融合、跨场景协同—社区健康医疗小屋的智能升级
大数据·人工智能·物联网·健康医疗
阿乔外贸日记5 小时前
中国汽车零配件出口企业情况
大数据·人工智能·智能手机·云计算·汽车