芯片设计重要工具—— IBM LSF 分布式高性能计算调度平台

IBM Spectrum® LSF® Suites 是面向分布式高性能计算 (HPC) 的工作负载管理平台和作业调度程序。基于 Terraform 的自动化现已可用,该功能可在 IBM Cloud® 上为基于 IBM Spectrum LSF 的集群供应和配置资源。

借助我们针对任务关键型 HPC 环境的集成解决方案,提高用户生产力和硬件使用,同时降低系统管理成本。异构、高扩展性和可用架构可为传统的高性能计算和高吞吐量工作负载提供支持,也适用于大数据、认知、GPU 机器学习和容器化工作负载。

借助动态 HPC 云支持,IBM Spectrum LSF Suites 使组织能够根据工作负载需求智能地使用云资源,并支持所有主要云供应商。

优势

1、加快工作负载

充分利用高级工作负载管理以及政策驱动型调度(包括 GPU 调度和动态混合云),以添加随需应变的容量。

2、提高工作效率

通过将增强的用户接口与政策和自动化相结合,创造更出色的成果。这消除了用户成为集群专家的需要,以便其持续聚焦成果。

3、简化管理

通常在不到一小时的时间内即可获得功能齐全的集群。充分利用对大型分布式系统的简单集中管理。

功能

1、完全集成的 UI 体验

借助更多访问 HPC 资源的方式提高用户生产力,包括用于作业监视和通知的移动设备客户端,以及用于 Windows 环境的集成式桌面客户端。使站点能够包含客户特定型自定义项和扩展名。

2、动态混合云

对混合 HPC 云的支持使工作负载能够转发到多个云,并且数据可以自动暂存到云或从云中暂存。云上使用的资源可根据工作负载需求和调度策略实现自动缩放。

3、简化的包装和安装

简化的安装流程支持从单个服务器快速部署到现有环境,此外还包括裸机安装功能。三个版本可供选择,其功能呈阶梯式增强。

4、专为企业而设计

高级功能可提高用户生产力和硬件使用率,同时降低系统管理成本。

5、自动化 GPU 配置

自动检测和配置 NVIDIA GPU 以简化 GPU 服务器的管理,并充分利用 NVIDIA GPU 的行为监视、运行状况和诊断以及会计和进程统计信息。

6、容器作为批处理作业

支持容器技术,包括 Docker、Shifter 和 Singularity。简化应用程序构建、测试和发货流程。在本地部署和云中一致地部署应用程序堆栈。

组件
IBM Spectrum LSF Analytics:一款用于可视化和分析大量工作负载数据,以改进决策的高级工具。

IBM Spectrum LSF Application Center:用于构建易于使用的、以应用程序为中心的 Web 界面,简化作业提交、管理和远程可视化。使用基于 Web 的界面远程监控作业,访问与作业相关的数据并执行基本操作。

IBM Spectrum LSF Data Manager:一款智能数据管理器,用于在 IBM Spectrum LSF 集群内和集群之间以及云之间自动传输数据。

IBM Spectrum LSF Explorer:适用于 IBM Spectrum LSF 集群的强大轻量级报告解决方案。

IBM Spectrum LSF License Scheduler:一种许可证管理工具,支持策略驱动的商业软件许可证分配和跟踪。实时监控许可证使用情况,帮助提高工作效率并增加对许可证资源的整体访问。

IBM Spectrum LSF Process Manager:一个功能强大的界面,用于设计复杂的工程计算流程,并捕获可供其他用户使用的可重复的最佳实践。与 IBM Spectrum LSF Application Center 集成,以创建一致的基于 Web 的环境。

IBM Spectrum LSF RTM:一个灵活的实时仪表板,用于监控全球工作负载和资源。及时了解 HPC 环境的当前状态,帮助改进决策、降低成本并提高服务级别。

IBM Spectrum LSF Session Scheduler:适用于 IBM Spectrum LSF 环境的高吞吐量、低延迟调度解决方案。安排高吞吐量、低延迟的工作负载,实现更快、更可预测的作业交付时间。

相关推荐
躺不平的理查德34 分钟前
General Spark Operations(Spark 基础操作)
大数据·分布式·spark
talle202136 分钟前
Zeppelin在spark环境导出dataframe
大数据·分布式·spark
渣渣盟43 分钟前
大数据开发环境的安装,配置(Hadoop)
大数据·hadoop·分布式
Angindem1 小时前
SpringClound 微服务分布式Nacos学习笔记
分布式·学习·微服务
龙仔72510 小时前
离线安装rabbitmq全流程
分布式·rabbitmq·ruby
〆、风神12 小时前
Spring Boot 整合 Lock4j + Redisson 实现分布式锁实战
spring boot·分布式·后端
胡萝卜糊了Ohh13 小时前
kafka
分布式·kafka
桑榆080615 小时前
Spark-Streaming核心编程
大数据·分布式·spark
nbsaas-boot17 小时前
分布式微服务架构,数据库连接池设计策略
分布式·微服务·架构