配置提交节点

方法一:配置lsf.cluster.<clustername>

到$LSF_TOP/conf目录,编辑lsf.cluster.<clustername>文件。将下面配置中的server列设置成0,此节点就会作为Login节点。此方法通过bhosts不可以查看到这个节点。

bash 复制代码
# cd $LSF_ENVDIR

# vim lsf.cluster.cluster1

Begin   Host

HOSTNAME  model    type        server  RESOURCES    #Keywords

master   !   !   1   (mg)

node02  !       !       1       ()

node01  !       !  0       ()

End     Host



# su - lsfadmin

$ lsadmin reconfig

$ badmin mbdrestart

如果使用lshosts查看lsf client的type、model是UNKNOWN,可以手动在lsf.cluster.<clustername>文件里为这个机子配置一个type。在type那列,将 !改为具体的type值,可运行lshosts -w查看type值。

配置如下所示:

bash 复制代码
[lsfadmin@master ~]$ lshosts -w

HOST_NAME       type       model  cpuf ncpus maxmem maxswp server RESOURCES

master          X86_64    Intel_E5  12.5     4   3.6G   3.8G    Yes (mg)

node02          X86_64    Intel_E5  12.5     4   3.6G   3.8G    Yes ()

node01          UNKNOWN UNKNOWN_    12.5     4   3.6G   3.8G    Yes ()

复制上面的type类型到lsf.cluster.<clustername>文件中。

bash 复制代码
# vim $LSF_ENVDIR/lsf.cluster.cluster1



Begin   Host

HOSTNAME  model    type        server  RESOURCES    #Keywords

master   !   !   1   (mg)

node02  !       !       1       ()

node01   Intel_E5    X86_64  0       ()

End     Host



# su - lsfadmin

$ lsadmin reconfig

$ badmin mbdrestart

方法二:配置lsb.hosts

将lsb.hosts文件中的 MXJ设置为0,代表此节点无资源,不接收作业。此方法通过bhosts可以查看到这个节点。

bash 复制代码
[root@master conf]# cd lsbatch/cluster1/configdir/
[root@master configdir]# vim lsb.hosts 
[root@master configdir]# grep -w 'Begin Host' lsb.hosts -A 10
Begin Host
HOST_NAME MXJ   r1m     pg    ls    tmp mem ut  DISPATCH_WINDOW  AFFINITY  # Keywords
default    !    ()      ()    ()     ()  ()  ()    ()		  (Y)   # Example
master    32    ()      ()    ()     ()   ()  ()  ()		  (Y)   # Example
node1   32    ()      ()    ()     ()  ()  ()   ()		  (Y)   # Example
node2   0    ()      ()    ()     ()   ()  ()  ()		  (Y)   # Example


[root@master configdir]# su - lsfadmin
[lsfadmin@master ~]$ badmin reconfig
相关推荐
高性能服务器2 个月前
探索GPU算力在大模型和高性能计算中的无限潜能
算法·语言模型·gpu算力·hpc·高性能计算
Eloudy2 个月前
基于 Householder 变换的 qr 分解 算法与源码实现
算法·hpc
小信瑞4 个月前
IBM Spectrum LSF Data Manager,独立于群集工作负载进行数据传输管理,以提高吞吐量并优化计算资源的使用
集群管理·计算资源管理·hpc·高性能计算·工作负载管理·作业调度系统·工作负载迁移
小信瑞5 个月前
分布式高性能计算 (HPC)的工作负载管理平台和作业调度程序—— IBM Spectrum® LSF® Suites
分布式·ibm lsf·计算资源管理·hpc·工作负载管理·作业调度系统·作业调度程序
boshushuoshuo5 个月前
LSF 任务运行失败,为什么任务状态却为DONE ?
lsf
whyte王7 个月前
CUDA 12.4文档5 编程接口-使用CUDA运行时-初始化&设备内存
gpu·cuda·hpc·高性能计算
whyte王7 个月前
CUDA 12.4文档2 内核&线程架构
架构·gpu·cuda·hpc
ZhaoDongyu_AK478 个月前
GEMM优化(RISC-V平台)
人工智能·性能优化·矩阵·risc-v·hpc·推理
boshushuoshuo9 个月前
LSF 主机状态 unreach 分析
eda·lsf·unreach