调度系统部署架构是什么样的呢?

简单示例一个部署架构图,如下所示:

📘 各组件说明:

服务器端组件(控制节点)
  • Slurmslurmctld(主控调度器),slurmdbd(数据库服务)
  • PBS Propbs_server(主控服务),pbs_sched(调度器)
  • LSFmbatchd(主控调度器),lsadmin(管理工具)
客户端组件(计算节点)
  • Slurmslurmd(守护进程,接收并执行任务)
  • PBS Propbs_mom(任务管理器)
  • LSFressbatchd(资源和作业守护进程)
共享存储系统
  • 所有节点通过网络挂载统一的文件系统,用于读写作业数据。

✅ 主控服务和调度器是否部署在同一台服务器?

情况一:小型或中型集群

  • 主控服务(如 pbs_serverslurmctld调度器(如 pbs_schedslurmdbd 通常部署在同一台服务器上。
  • 优点:
    • 简化部署和维护;
    • 节省硬件资源;
    • 网络通信延迟低。

情况二:大型或高可用集群

  • 主控服务和调度器可以部署在不同的服务器 上,甚至采用冗余部署(如主备模式)。
  • 例如:
    • Slurm 支持将 slurmctldslurmdbd 分开部署;
    • PBS Pro 可以将 pbs_serverpbs_sched 分离,提高调度性能;
    • LSF 支持多级调度架构,调度器可以分布式部署。
集群规模 是否分离部署主控与调度器 推荐做法
小型(<50节点) ❌ 不分离 同一台服务器部署即可
中型(50--500) ✅ 可选分离 根据负载决定是否分离
大型(>500) ✅ 建议分离 提高性能与可维护性
高可用需求 ✅ 建议主备部署 增加容错能力
相关推荐
辰风沐阳6 小时前
ThinkPHP8.1 + think-swoole 4.1 使用指南(保姆级教程)
linux·后端·swoole
Ajie'Blog6 小时前
Claude 大模型深度评测:从参数架构到实战边界
大数据·人工智能·架构
大明者省6 小时前
IIS 端口绑定正常访问的原理说明与常见误区澄清
运维·服务器·笔记
tedcloud1236 小时前
ai-engineering-from-scratch部署教程:从零搭建AI应用环境
服务器·前端·人工智能·系统架构·edge
mounter6257 小时前
迈向硬件级无缝热升级:Linux 内核 VFIO 与 IOMMU 持久化技术的演进之路
linux·服务器·内存管理·kernel
晚风吹红霞7 小时前
Linux软件包管理器详解 —— yum与apt的使用及软件生态
linux·运维·服务器
曦夜日长7 小时前
Linux系统篇,进程概念(一):计算机体系、操作系统的认识、程序的加载过程
linux·运维·网络
喵个咪7 小时前
AI重构软件开发范式:框架与脚手架为何仍是生产级开发的刚需?
架构·go·ai编程
似水এ᭄往昔7 小时前
【Linux网络编程】--Socket编程预备
linux·服务器·网络
皮卡狮7 小时前
环境变量详解
linux