Hadoop集群时间同步方法

本文基于Lniux的Ubuntu发行版对Hadoop集群时间进行同步操作。

首先我们得了解什么是NTP服务:

NTP(Network Time Protocol,网络时间协议)是用于同步计算机时间的网络协议,核心作用:

  1. 解决分布式集群中「节点时间不一致」的问题 ------Hadoop 集群的任务调度、日志记录、数据同步等依赖统一时间戳,时间偏差会导致任务失败、数据错乱;
  2. 工作原理:指定一台机器(hadoop102)作为「时间服务器」,其他节点定期(如每 10 分钟)向它发送请求,校准自身系统时间,确保整个集群时间统一;

所以我们得先在机器中安装NTP服务:

复制代码
# 更新软件包列表(可选,确保安装最新版本)
sudo apt update

# 安装NTP服务(对应CentOS的yum install -y ntp)
sudo apt install -y ntp

# 验证安装成功(查看服务状态)
sudo systemctl status ntp

具体配置分配,这里以三台机器102、103、104为例:

  1. hadoop102(时间服务器):安装 NTP 服务并配置为「时间主节点」,提供集群内统一时间源;
  2. hadoop103/hadoop104(普通节点) :也需安装 NTP 相关组件(实际安装 ntp 包后,会包含 ntpdate 工具),用于执行定时同步命令(ntpdate hadoop102)。
  1. 编辑配置文件:

    复制代码
    sudo vim /etc/ntp.conf
  2. 关键配置修改(按文档要求调整):

  • 授权集群网段同步 :找到 #restrict 192.168.1.0 mask 255.255.255.0 nomodify notrap,删除开头 # 注释(允许 192.168.1.0/24 网段节点同步)。
  • 禁用外网时间服务器 :给以下 4 行添加 # 注释(集群仅依赖本地时间服务器):
    *

    复制代码
      #server 0.ubuntu.pool.ntp.org iburst
      #server 1.ubuntu.pool.ntp.org iburst
      #server 2.ubuntu.pool.ntp.org iburst
      #server 3.ubuntu.pool.ntp.org iburst

或者是任何pool开头的

  • 添加本地时间源 :在文件末尾添加(断网时仍可提供时间):

    复制代码
    server 127.127.1.0  # 本地时间源
    fudge 127.127.1.0 stratum 10  # 时间层级(避免对外提供服务)
  • 保存退出(:wq),重启 NTP 服务:

    sudo systemctl restart ntp
    sudo systemctl enable ntp # 开机自启

二、hadoop103/hadoop104(普通节点):指向时间服务器同步

核心目标:不对外提供服务,仅定期从 hadoop102 同步时间。

  1. 编辑配置文件:

    复制代码
    sudo vim /etc/ntp.conf
  2. 关键配置修改:删除 / 注释所有外网时间服务器 :同 hadoop102,注释掉 0.ubuntu.pool.ntp.org 等 4 行。

  • 添加时间服务器(hadoop102) :在文件末尾添加(优先同步 hadoop102 时间):

    复制代码
    server hadoop102 iburst  # 指向集群时间服务器,iburst 加速同步
    server 127.127.1.0  # 兜底:若 hadoop102 不可用,用本地时间
    fudge 127.127.1.0 stratum 10
  1. 禁用自身作为时间服务器 :确保文件中无 restrict 授权其他网段的配置(仅保留默认的本地限制即可)。
  • 保存退出,关闭 NTP 服务(普通节点无需运行 ntpd 守护进程,依赖 ntpdate 定时同步):

    复制代码
    sudo systemctl stop ntp
    sudo systemctl disable ntp  # 禁止开机自启,避免冲突

清除 NTP 缓存并重启服务

复制代码
# 停止 NTP 服务
sudo systemctl stop ntp
# 清除外网同步缓存(关键:避免残留连接)
sudo rm -rf /var/lib/ntp/ntp.drift /var/lib/ntp/peers.cache
# 重启 NTP 服务
sudo systemctl start ntp
# 验证配置是否生效
sudo ntpq -p
理想输出:remote 列仅保留 LOCAL(0)(本地时间源),所有外网节点消失或 reach 列变为 0。

三、验证

在102端口输入:

复制代码
sudo netstat -tuln | grep 123

输出:

即为正常,123 是 NTP(Network Time Protocol,网络时间协议)的默认端口,专门用于计算机之间的时间同步通信。

模拟偏差:

在 hadoop103 手动修改时间(模拟时间偏差):

复制代码
sudo date -s "2025-01-01 10:00:00"

等待 10 分钟手动触发同步:

复制代码
sudo ntpdate hadoop102
相关推荐
dingzd952 小时前
AI 代理购物落地后,真正的“增量岗位”叫——商品数据工程
大数据·人工智能·跨境电商·内容营销·跨境
無森~2 小时前
HBase Java API
java·大数据·hbase
sensen_kiss2 小时前
Jupter Notebook 使用教程
大数据·人工智能·python·学习·数据分析
m0_687399842 小时前
telnet localhost 15672 RabbitMQ “Connection refused“ 错误表示目标主机拒绝了连接请求。
分布式·rabbitmq
八月瓜科技2 小时前
2026春晚机器人专利战:从舞台秀到资本竞逐的产业突围
大数据·人工智能·microsoft·机器人·娱乐
伟大的大威2 小时前
NVIDIA DGX Spark (ARM64/Blackwell) Kubernetes 集群 + GPU Operator 完整部署指南
大数据·spark·kubernetes
LaughingZhu2 小时前
Product Hunt 每日热榜 | 2026-02-05
大数据·数据库·人工智能·经验分享·搜索引擎·产品运营
零一科技2 小时前
centos7安装hadoop3(上)
hadoop
陌上丨2 小时前
生产环境分布式锁的常见问题和解决方案有哪些?
分布式
新新学长搞科研2 小时前
【智慧城市专题IEEE会议】第六届物联网与智慧城市国际学术会议(IoTSC 2026)
人工智能·分布式·科技·物联网·云计算·智慧城市·学术会议