调度系统部署架构是什么样的呢?

简单示例一个部署架构图,如下所示:

📘 各组件说明:

服务器端组件(控制节点)
  • Slurmslurmctld(主控调度器),slurmdbd(数据库服务)
  • PBS Propbs_server(主控服务),pbs_sched(调度器)
  • LSFmbatchd(主控调度器),lsadmin(管理工具)
客户端组件(计算节点)
  • Slurmslurmd(守护进程,接收并执行任务)
  • PBS Propbs_mom(任务管理器)
  • LSFressbatchd(资源和作业守护进程)
共享存储系统
  • 所有节点通过网络挂载统一的文件系统,用于读写作业数据。

✅ 主控服务和调度器是否部署在同一台服务器?

情况一:小型或中型集群

  • 主控服务(如 pbs_serverslurmctld调度器(如 pbs_schedslurmdbd 通常部署在同一台服务器上。
  • 优点:
    • 简化部署和维护;
    • 节省硬件资源;
    • 网络通信延迟低。

情况二:大型或高可用集群

  • 主控服务和调度器可以部署在不同的服务器 上,甚至采用冗余部署(如主备模式)。
  • 例如:
    • Slurm 支持将 slurmctldslurmdbd 分开部署;
    • PBS Pro 可以将 pbs_serverpbs_sched 分离,提高调度性能;
    • LSF 支持多级调度架构,调度器可以分布式部署。
集群规模 是否分离部署主控与调度器 推荐做法
小型(<50节点) ❌ 不分离 同一台服务器部署即可
中型(50--500) ✅ 可选分离 根据负载决定是否分离
大型(>500) ✅ 建议分离 提高性能与可维护性
高可用需求 ✅ 建议主备部署 增加容错能力
相关推荐
Johny_Zhao6 小时前
OpenClaw安装部署教程
linux·人工智能·ai·云计算·系统运维·openclaw
ray_liang14 小时前
用六边形架构与整洁架构对比是伪命题?
java·架构
Java编程爱好者15 小时前
字节二面:被问“大模型知识过时了怎么解?”,我答“微调”,面试官当场黑脸:“听说过 RAG 吗?”
架构
葫芦的运维日志19 小时前
从手动部署到GitOps只需四步
架构
sumuve19 小时前
从100行到1行:我是如何重构IoT设备实时数据通信的?
架构·响应式设计
koddnty20 小时前
c++协程控制流深入剖析
后端·架构
YuMiao20 小时前
gstatic连接问题导致Google Gemini / Studio页面乱码或图标缺失问题
服务器·网络协议
Mintopia20 小时前
Vite 与 Uni-App X 的协作原理:从前端开发到多端运行的桥梁
架构
louiX1 天前
深入理解 Android BLE GATT 回调机制:从“回调地狱”到高可靠 OTA 架构
架构
aircrushin2 天前
轻量化大模型架构演进
人工智能·架构