调度系统部署架构是什么样的呢?

简单示例一个部署架构图,如下所示:

📘 各组件说明:

服务器端组件(控制节点)
  • Slurmslurmctld(主控调度器),slurmdbd(数据库服务)
  • PBS Propbs_server(主控服务),pbs_sched(调度器)
  • LSFmbatchd(主控调度器),lsadmin(管理工具)
客户端组件(计算节点)
  • Slurmslurmd(守护进程,接收并执行任务)
  • PBS Propbs_mom(任务管理器)
  • LSFressbatchd(资源和作业守护进程)
共享存储系统
  • 所有节点通过网络挂载统一的文件系统,用于读写作业数据。

✅ 主控服务和调度器是否部署在同一台服务器?

情况一:小型或中型集群

  • 主控服务(如 pbs_serverslurmctld调度器(如 pbs_schedslurmdbd 通常部署在同一台服务器上。
  • 优点:
    • 简化部署和维护;
    • 节省硬件资源;
    • 网络通信延迟低。

情况二:大型或高可用集群

  • 主控服务和调度器可以部署在不同的服务器 上,甚至采用冗余部署(如主备模式)。
  • 例如:
    • Slurm 支持将 slurmctldslurmdbd 分开部署;
    • PBS Pro 可以将 pbs_serverpbs_sched 分离,提高调度性能;
    • LSF 支持多级调度架构,调度器可以分布式部署。
集群规模 是否分离部署主控与调度器 推荐做法
小型(<50节点) ❌ 不分离 同一台服务器部署即可
中型(50--500) ✅ 可选分离 根据负载决定是否分离
大型(>500) ✅ 建议分离 提高性能与可维护性
高可用需求 ✅ 建议主备部署 增加容错能力
相关推荐
伟兮7 分钟前
iOS日志系统设计
架构
AOwhisky26 分钟前
Linux逻辑卷管理:从“固定隔间”到“弹性存储池”的智慧
linux·运维·服务器
翼龙云_cloud42 分钟前
阿里云渠道商:如何使用弹性伸缩来实现计算资源的弹性配置?
服务器·阿里云·云计算
05大叔1 小时前
大事件Day02
运维·服务器
五仁火烧1 小时前
Vue3 项目的默认端口行为
服务器·vue.js·nginx·容器·vue
C Yu小白2 小时前
Linux系统调用与文件操作详解
linux·运维·服务器
ZFB00012 小时前
【麒麟桌面系统】V10-SP1 2503 系统知识——常见用户组简介
linux·运维·kylin
acrelgxy2 小时前
告别被动抢修与盲目巡检!安科瑞运维云平台,让电力系统实现预测性守护。
运维·电力监控系统·智能电力仪表
EndingCoder2 小时前
类的继承和多态
linux·运维·前端·javascript·ubuntu·typescript
Anyexyz3 小时前
【更新】境内 Docker 镜像状态监控——配置生成,一键复制!
运维·docker·容器