查看队列资源限额和用户资源使用情况

查看队列资源限额和用户资源使用情况

背景

LSF中的 limits 配置模块允许管理员很方便地设置集群资源限额,可以在队列、主机对、应用维度对用户使用的资源如slot/core,、任务数/jobs、内存/mem、交换区/swap,以及自定义资源比如许可证进行限制。

问题

在实际工作中,用户遇到的问题是如何方便快捷地查看队列上设置的资源限额,以及当前用户资源使用情况?

解决方案

LSF提供了 blimits 命令查询限额配置和用户资源使用情况,但需要使用不同的参数组合,运行多次。 我们可以通过创建脚本 bquota 通过一条命令显示队列上配置的资源限额和用户资源使用情况。简化用户操作,不需要记忆复杂的参数。

bquota 脚本示例如下:

bash 复制代码
#!/bin/bash

queueName=$1

[ "x$queueName" == "x" ] && {
    echo "请指定队列名称。"
    exit 1
}

echo "***** 队列 ${queueName} 任务资源限额配置 *****"
echo
t=$(blimits -c -q ${queueName})
[ "$t" == "No resource configuration found." ] && {
    echo "没有配置队列任务资源限额"
} || {
    blimits -c -q ${queueName}
}

echo

for l in $(blimits -c -q ${queueName}|grep NAME|awk -F = '{ print $2 }')
do
    echo "***** ${l} 资源使用 *****"
    t=$(blimits -w -n $l)
    [ "$t" == "No resource usage found." ] && {
        echo "无资源使用记录"
    } || {
        blimits -w -n $l
    }
    echo
done

使用方式

使用方式很直接,在命令行跟上队列名称即可

复制代码
bquota queue_name
ini 复制代码
[lsfadmin@master bin]$ bquota admin
***** 队列 admin 任务资源限额配置 *****

Begin Limit
  NAME 		= admin_limit
  PER_USER 	= lsfadmin
  PER_QUEUE 	= admin
  SLOTS    	= 100
  JOBS     	= 10
End Limit


***** admin_limit 资源使用 *****

INTERNAL RESOURCE LIMITS:

    NAME          USERS            QUEUES           HOSTS           PROJECTS       APPS    SLOTS     MEM      TMP      SWP      JOBS
admin_limit      lsfadmin          admin              -                -            -      10/100     -        -        -      10/10
相关推荐
℡終嚸♂68018 分钟前
红帽系统(RHEL 8/9)安装与配置Nginx全攻略
运维·chrome·nginx
人工智能训练1 小时前
在Windows系统Docker中使用wsl2、容器、windows文件路径三种不同挂载方式的区别和性能差异
运维·服务器·人工智能·windows·docker·容器·wsl2
yangmf20401 小时前
APM(三):监控 Python 服务链
大数据·运维·开发语言·python·elk·elasticsearch·搜索引擎
百***06011 小时前
服务器无故nginx异常关闭之kauditd0 kswapd0挖矿病毒 CPU占用200% 内存耗尽
运维·服务器·nginx
L.EscaRC1 小时前
Nginx核心原理机制及其代理实现解析
运维·nginx
Robpubking2 小时前
elasticsearch 使用 systemd 启动时卡在 starting 状态 解决过程记录
linux·运维·elasticsearch
t***L2662 小时前
DevOps自动化部署
运维·自动化·devops
天生励志1232 小时前
【Linux系统运维】软件安装部署实战--软件安装4-运维监控
运维·zabbix·grafana
2501_941800883 小时前
Python高性能日志分析与Elasticsearch实战分享:海量日志索引、检索与可视化优化经验
运维·jenkins
CIANTECH_Heidi3 小时前
精准配置重构光模块成本效能:深圳光特通信1X9、SFP单收/单发光模块
运维·服务器·网络·数据库·光模块