芯片设计重要工具—— IBM LSF 分布式高性能计算调度平台

IBM Spectrum® LSF® Suites 是面向分布式高性能计算 (HPC) 的工作负载管理平台和作业调度程序。基于 Terraform 的自动化现已可用,该功能可在 IBM Cloud® 上为基于 IBM Spectrum LSF 的集群供应和配置资源。

借助我们针对任务关键型 HPC 环境的集成解决方案,提高用户生产力和硬件使用,同时降低系统管理成本。异构、高扩展性和可用架构可为传统的高性能计算和高吞吐量工作负载提供支持,也适用于大数据、认知、GPU 机器学习和容器化工作负载。

借助动态 HPC 云支持,IBM Spectrum LSF Suites 使组织能够根据工作负载需求智能地使用云资源,并支持所有主要云供应商。

优势

1、加快工作负载

充分利用高级工作负载管理以及政策驱动型调度(包括 GPU 调度和动态混合云),以添加随需应变的容量。

2、提高工作效率

通过将增强的用户接口与政策和自动化相结合,创造更出色的成果。这消除了用户成为集群专家的需要,以便其持续聚焦成果。

3、简化管理

通常在不到一小时的时间内即可获得功能齐全的集群。充分利用对大型分布式系统的简单集中管理。

功能

1、完全集成的 UI 体验

借助更多访问 HPC 资源的方式提高用户生产力,包括用于作业监视和通知的移动设备客户端,以及用于 Windows 环境的集成式桌面客户端。使站点能够包含客户特定型自定义项和扩展名。

2、动态混合云

对混合 HPC 云的支持使工作负载能够转发到多个云,并且数据可以自动暂存到云或从云中暂存。云上使用的资源可根据工作负载需求和调度策略实现自动缩放。

3、简化的包装和安装

简化的安装流程支持从单个服务器快速部署到现有环境,此外还包括裸机安装功能。三个版本可供选择,其功能呈阶梯式增强。

4、专为企业而设计

高级功能可提高用户生产力和硬件使用率,同时降低系统管理成本。

5、自动化 GPU 配置

自动检测和配置 NVIDIA GPU 以简化 GPU 服务器的管理,并充分利用 NVIDIA GPU 的行为监视、运行状况和诊断以及会计和进程统计信息。

6、容器作为批处理作业

支持容器技术,包括 Docker、Shifter 和 Singularity。简化应用程序构建、测试和发货流程。在本地部署和云中一致地部署应用程序堆栈。

组件
IBM Spectrum LSF Analytics:一款用于可视化和分析大量工作负载数据,以改进决策的高级工具。

IBM Spectrum LSF Application Center:用于构建易于使用的、以应用程序为中心的 Web 界面,简化作业提交、管理和远程可视化。使用基于 Web 的界面远程监控作业,访问与作业相关的数据并执行基本操作。

IBM Spectrum LSF Data Manager:一款智能数据管理器,用于在 IBM Spectrum LSF 集群内和集群之间以及云之间自动传输数据。

IBM Spectrum LSF Explorer:适用于 IBM Spectrum LSF 集群的强大轻量级报告解决方案。

IBM Spectrum LSF License Scheduler:一种许可证管理工具,支持策略驱动的商业软件许可证分配和跟踪。实时监控许可证使用情况,帮助提高工作效率并增加对许可证资源的整体访问。

IBM Spectrum LSF Process Manager:一个功能强大的界面,用于设计复杂的工程计算流程,并捕获可供其他用户使用的可重复的最佳实践。与 IBM Spectrum LSF Application Center 集成,以创建一致的基于 Web 的环境。

IBM Spectrum LSF RTM:一个灵活的实时仪表板,用于监控全球工作负载和资源。及时了解 HPC 环境的当前状态,帮助改进决策、降低成本并提高服务级别。

IBM Spectrum LSF Session Scheduler:适用于 IBM Spectrum LSF 环境的高吞吐量、低延迟调度解决方案。安排高吞吐量、低延迟的工作负载,实现更快、更可预测的作业交付时间。

相关推荐
BUTCHER56 小时前
Filebeat输出Kafka配置
分布式·kafka
测试人社区-浩辰11 小时前
AI与区块链结合的测试验证方法
大数据·人工智能·分布式·后端·opencv·自动化·区块链
老友@12 小时前
分布式事务完全演进链:从单体事务到 TCC 、Saga 与最终一致性
分布式·后端·系统架构·事务·数据一致性
【赫兹威客】浩哥16 小时前
【赫兹威客】完全分布式ZooKeeper测试教程
分布式·zookeeper·云原生
一晌小贪欢16 小时前
Python 魔术方法实战:深度解析 Queue 模块的模块化设计与实现
开发语言·分布式·爬虫·python·python爬虫·爬虫分布式
【赫兹威客】浩哥16 小时前
【赫兹威客】伪分布式Flink测试教程
大数据·分布式·flink
小北方城市网16 小时前
Spring Cloud Gateway 生产级微内核架构设计与可插拔过滤器开发
java·大数据·linux·运维·spring boot·redis·分布式
(;_;)(╥ω╥`)17 小时前
kafka原理剖析(一)
分布式·kafka·linq
码农水水17 小时前
京东Java面试被问:分布式会话的一致性和容灾方案
java·开发语言·数据库·分布式·mysql·面试·职场和发展
【赫兹威客】浩哥17 小时前
【赫兹威客】完全分布式Spark测试教程
大数据·分布式·spark