调度系统部署架构是什么样的呢?

简单示例一个部署架构图,如下所示:

📘 各组件说明:

服务器端组件(控制节点)
  • Slurmslurmctld(主控调度器),slurmdbd(数据库服务)
  • PBS Propbs_server(主控服务),pbs_sched(调度器)
  • LSFmbatchd(主控调度器),lsadmin(管理工具)
客户端组件(计算节点)
  • Slurmslurmd(守护进程,接收并执行任务)
  • PBS Propbs_mom(任务管理器)
  • LSFressbatchd(资源和作业守护进程)
共享存储系统
  • 所有节点通过网络挂载统一的文件系统,用于读写作业数据。

✅ 主控服务和调度器是否部署在同一台服务器?

情况一:小型或中型集群

  • 主控服务(如 pbs_serverslurmctld调度器(如 pbs_schedslurmdbd 通常部署在同一台服务器上。
  • 优点:
    • 简化部署和维护;
    • 节省硬件资源;
    • 网络通信延迟低。

情况二:大型或高可用集群

  • 主控服务和调度器可以部署在不同的服务器 上,甚至采用冗余部署(如主备模式)。
  • 例如:
    • Slurm 支持将 slurmctldslurmdbd 分开部署;
    • PBS Pro 可以将 pbs_serverpbs_sched 分离,提高调度性能;
    • LSF 支持多级调度架构,调度器可以分布式部署。
集群规模 是否分离部署主控与调度器 推荐做法
小型(<50节点) ❌ 不分离 同一台服务器部署即可
中型(50--500) ✅ 可选分离 根据负载决定是否分离
大型(>500) ✅ 建议分离 提高性能与可维护性
高可用需求 ✅ 建议主备部署 增加容错能力
相关推荐
一只自律的鸡11 分钟前
【Linux驱动】bug处理 ens33找不到IP
linux·运维·bug
17(无规则自律)26 分钟前
【CSAPP 读书笔记】第二章:信息的表示和处理
linux·嵌入式硬件·考研·高考
!chen26 分钟前
linux服务器静默安装Oracle26ai
linux·运维·服务器
莫大33029 分钟前
2核2G云服务器PHP8.5+MySQL9.0+Nginx(LNMP)安装WordPress网站详细教程
运维·服务器·nginx
刚刚入门的菜鸟31 分钟前
php-curl
运维·web安全·php
REDcker44 分钟前
Linux 文件描述符与 Socket 选项操作详解
linux·运维·网络
蒹葭玉树1 小时前
【C++上岸】C++常见面试题目--操作系统篇(第二十八期)
linux·c++·面试
2501_927773071 小时前
imx6驱动
linux·运维·服务器
hy____1231 小时前
Linux_进程间通信
linux·运维·服务器
银发控、2 小时前
nginx静态资源
运维·nginx