调度系统部署架构是什么样的呢?

简单示例一个部署架构图,如下所示:

📘 各组件说明:

服务器端组件(控制节点)
  • Slurmslurmctld(主控调度器),slurmdbd(数据库服务)
  • PBS Propbs_server(主控服务),pbs_sched(调度器)
  • LSFmbatchd(主控调度器),lsadmin(管理工具)
客户端组件(计算节点)
  • Slurmslurmd(守护进程,接收并执行任务)
  • PBS Propbs_mom(任务管理器)
  • LSFressbatchd(资源和作业守护进程)
共享存储系统
  • 所有节点通过网络挂载统一的文件系统,用于读写作业数据。

✅ 主控服务和调度器是否部署在同一台服务器?

情况一:小型或中型集群

  • 主控服务(如 pbs_serverslurmctld调度器(如 pbs_schedslurmdbd 通常部署在同一台服务器上。
  • 优点:
    • 简化部署和维护;
    • 节省硬件资源;
    • 网络通信延迟低。

情况二:大型或高可用集群

  • 主控服务和调度器可以部署在不同的服务器 上,甚至采用冗余部署(如主备模式)。
  • 例如:
    • Slurm 支持将 slurmctldslurmdbd 分开部署;
    • PBS Pro 可以将 pbs_serverpbs_sched 分离,提高调度性能;
    • LSF 支持多级调度架构,调度器可以分布式部署。
集群规模 是否分离部署主控与调度器 推荐做法
小型(<50节点) ❌ 不分离 同一台服务器部署即可
中型(50--500) ✅ 可选分离 根据负载决定是否分离
大型(>500) ✅ 建议分离 提高性能与可维护性
高可用需求 ✅ 建议主备部署 增加容错能力
相关推荐
“愿你如星辰如月”12 分钟前
Linux:进程间通信
linux·运维·服务器·c++·操作系统
10岁的博客32 分钟前
二维差分算法高效解靶场问题
java·服务器·算法
lwhdjbcjdjd1 小时前
Nginx与Tomcat协作处理流程及数据流向
运维·nginx·tomcat
CIb0la1 小时前
安卓16系统升级后(Google pixel 8/8pro 9/9pro xl 10/10pro xl)救砖及Root方法
android·运维·生活
Ya-Jun1 小时前
项目实战Now in Android:项目模块说明
android·架构·kotlin
呉師傅2 小时前
国产化操作系统---银河麒麟安装步骤(简单介绍)
运维·网络·windows·单片机·电脑
天上的光2 小时前
软件体系结构——基本架构演变
架构
Code Warrior2 小时前
【Linux】应用层协议HTTP
linux·网络·网络协议·http
Hello,C++!3 小时前
linux下libcurl的https简单例子
linux·数据库·https
踏雪Vernon3 小时前
[OpenHarmony6.0][Docker][环境]OHOS6 编译环境构建指南
运维·docker·容器