【生产级实战】Linux 集群时间同步详解(NTP + Cron,超详细)

【生产级实战】Linux 集群时间同步详解(NTP + Cron,超详细)

一:概述

👍本文将以 CentOS 集群 为例,详细讲解 内网环境下的 NTP 集群时间同步方案,一步一步带你从原理到落地。

如果服务器在公网环境(能连接外网),可以不采用集群时间同步,因为服务器会定期和公网时间进行校准;

如果服务器在内网环境,必须要配置集群时间同步,否则时间久了,会产生时间偏差,导致集群执行任务时间不同步。

找一个机器,作为时间服务器,所有的机器与这台集群时间进行定时的同步,生产环境根据任务对时间的准确程度要求周期同步。测试环境为了尽快看到效果,采用1分钟同步一次。


二:方案

✅方案设计:

  • 选 1 台服务器作为时间服务器

  • 其他节点定时向该服务器同步时间

✅示例集群:

  • hadoop102 → 时间服务器(NTP Server)
  • hadoop103 → 客户端
  • hadoop104 → 客户端

✅同步策略:

  • 测试环境:每 1 分钟同步一次

  • 生产环境:可调整为 5~10 分钟


三:部署

1)时间服务器(hadoop102)配置

  1. 查看 ntpd 服务状态

    bash 复制代码
    [lmc@hadoop102 ~]$ sudo systemctl status ntpd
  2. 启动 ntpd 服务

    bash 复制代码
    [lmc@hadoop102 ~]$ sudo systemctl start ntpd
  3. 设置 ntpd 开机自启

    bash 复制代码
    [lmc@hadoop102 ~]$ sudo systemctl enable ntpd
  4. 验证是否已设置为开机启动

    bash 复制代码
    [lmc@hadoop102 ~]$ sudo systemctl is-enabled ntpd
  5. 配置 NTP 服务文件

    bash 复制代码
    [lmc@hadoop102 ~]$ sudo vim /etc/ntp.conf
    bash 复制代码
    # 允许 192.168.2.0 网段的机器同步时间
    restrict 192.168.2.0 mask 255.255.255.0 nomodify notrap
    
    # 当外部时间源不可用时,使用本地时间作为时间源
    server 127.127.1.0
    fudge 127.127.1.0 stratum 10
    
    # 集群在内网环境,禁止使用公网时间服务器
    #server 0.centos.pool.ntp.org iburst
    #server 1.centos.pool.ntp.org iburst
    #server 2.centos.pool.ntp.org iburst
    #server 3.centos.pool.ntp.org iburst
  6. 配置硬件时间同步

    含义:系统时间同步的同时,同步硬件时钟,防止重启后时间回退。

    bash 复制代码
    [lmc@hadoop102 ~]$ sudo vim /etc/sysconfig/ntpd
    bash 复制代码
    # 添加这一行即可
    SYNC_HWCLOCK=yes
  7. 重启 ntpd 服务

    含义:系统时间同步的同时,同步硬件时钟,防止重启后时间回退。

    bash 复制代码
    [lmc@hadoop102 ~]$ sudo systemctl restart ntpd

2)客户端节点(hadoop103 / hadoop104)配置

此处以hadoop103举例,hadoop104同样配置即可

  1. 关闭客户端 ntpd 服务

    bash 复制代码
    [lmc@hadoop103 ~]$ sudo systemctl stop ntpd
    [lmc@hadoop103 ~]$ sudo systemctl disable ntpd
  2. 配置定时任务同步时间

    bash 复制代码
    [lmc@hadoop103 ~]$ sudo crontab -e
    bash 复制代码
    # 添加这一行即可
    */1 * * * * /usr/sbin/ntpdate hadoop102
  3. 查看定时任务是否生效

    bash 复制代码
    [lmc@hadoop103 ~]$ sudo crontab -l

3)验证时间同步效果

  1. 手动修改某台客户端时间

    bash 复制代码
    sudo date -s "2022-08-08 10:08:05"
  2. 等待 1 分钟后查看时间 如果时间恢复为与 hadoop102 一致,说明同步成功 ✅

    bash 复制代码
    date

总结

在内网集群环境中,应选取一台服务器作为 NTP 时间服务器,其余节点通过定时任务同步时间,确保整个集群时间高度一致,为分布式系统稳定运行打下基础。

生产环境建议(经验总结):

  • 时间服务器 只保留 1 台
  • 客户端 只用 ntpdate + cron
  • 不要多台互相同步
  • Hadoop / Kafka / ZK 集群部署前 先同步时间
相关推荐
safestar201215 小时前
ES批量写入性能调优:BulkProcessor 参数详解与实战案例
java·大数据·运维·jenkins
来一颗砂糖橘15 小时前
负载均衡的多维深度解析
运维·负载均衡
楠奕15 小时前
CentOS7安装GoldenDB单机搭建及常见报错解决方案
linux·运维·服务器
GCTTTTTT16 小时前
远程服务器走本地代理
运维·服务器
剑锋所指,所向披靡!16 小时前
Linux常用指令(2)
linux·运维·服务器
做咩啊~16 小时前
6.增加一个flat网段
服务器·openstack
不愿透露姓名的大鹏16 小时前
Oracle归档日志爆满急救指南
linux·数据库·oracle·dba
飞Link16 小时前
逆向兼容的桥梁:3to2 自动化降级工具实现全解析
运维·开发语言·python·自动化
W.W.H.16 小时前
嵌入式常见的面试题1
linux·网络·经验分享·网络协议·tcp/ip
木白CPP16 小时前
DMA-Buffer内核驱动API文档
linux