智能算力产品与解决方案提供商广州广电五舟科技股份有限公司(简称"广电五舟"),作为openFuyao社区技术委员会成员、商业发行版伙伴,积极推动AI云原生技术的自主创新与算力生态的繁荣发展,持续推进社区技术商业化落地。近期,广电五舟以openFuyao为底座,推出自研算力容器平台PentaPleiades,开创性地实现了基于HPC、AI双栈融合架构。
部分内容转载自 | 广电五舟(ID:GRGWUZHOU)
在科研创新冲刺、工业仿真提速的当下,高性能计算(HPC)早已成为不可或缺的核心基础设施,但传统HPC架构存在资源浪费、配置耗时、调度卡顿、运维繁琐等问题,这些瓶颈不仅推高了算力成本,更在无形中拖慢了创新的步伐。
五舟算力容器平台基于openFuyao实现HPC与AI双栈融合
广电五舟基于多年丰富的HPC(高性能计算)与 AI(人工智能)融合实践经验,推出自研算力容器平台PentaPleiades。该平台以openFuyao为底座,构建了统一资源抽象层、异构任务调度引擎与跨栈运行时环境,开创性地实现了HPC与AI的双栈深度融合,开启云原生高性能计算全新时代,让每一份算力都发挥极致价值!

PentaPleiades并非替代Slurm调度器,而是助力其在云原生时代焕发新活力------保留sbatch、srun、squeue等常用命令行接口,贴合科研人员使用习惯,同时融合K8s的弹性、敏捷与现代化运维能力。从架构层重构资源抽象、任务编排与用户交互范式,PentaPleiades直击"高投入、低产出、难运维、体验差"四大核心痛点,助力传统HPC轻松完成云原生升级。

PentaPleiades 4大核心优势重新定义高性能计算体验
优势1: 资源利用率革命性提升,算力不浪费
首创"时空耦合资源切片"技术,将华为昇腾等异构资源在时间维度实现毫秒级弹性分时复用,空间维度通过轻量级容器化隔离+共享内存加速,实现跨作业零拷贝数据流转。内嵌实时负载感知引擎,实时采集PCIe带宽、显存碎片率等硬件指标,动态匹配最优资源单元。据华中师范大学实际部署数据显示:同等SLA前提下,XPU平均利用率从28%跃升至78%,峰值达91.3%,作业排队时间下降65%,集群吞吐量提升2.4倍,相当于用原有硬件,释放近2.5倍有效算力。
优势2:用户体验质的飞跃,专注核心创新
构建"环境即代码(EaC)"全栈交付体系,用户只需提交一份YAML声明,标注镜像、依赖、硬件规格等信息,平台便自动完成环境拉取、资源预分配,以及JupyterLab、VS Code Server等IDE的秒级实例化,彻底告别繁琐配置。更支持XPU直通模式下的实时调试、内存异常热定位,以及分布式训练梯度流可视化追踪,取代传统繁琐调试方式;作业状态通过WebGL三维拓扑图实时渲染,异常节点自动高亮并关联根因分析,让科研人员摆脱琐事,专注核心研究。
优势3:智能调度+成本优化,算得省更算得快
采用多目标强化学习框架(PPO算法),同步优化任务完成时间、能效比与计费成本三大目标,兼顾效率与经济性。智能抢占机制可实现细粒度检查点保存,高优先级任务触发抢占时,80ms内冻结低优先级任务,恢复后精度损失<1e-6;动态定价模块对接电力峰谷与集群负载,自动调节计费权重,夜间训练成本可降至0.35倍;能效感知调度优先将密集型任务分配至液冷节点,实测降低数据中心整体PUE达0.12,践行绿色算力理念。
优势4:极简运维智能管控,压力直降90%
统一控制平面实现全栈纳管,涵盖基础设施层、平台层、应用层,IT团队无需在繁杂设备与软件间来回切换。预测性维护引擎可提前72小时预警XPU显存坏块、电源老化等故障,预警准确率98.7%;三级容错机制保障断点续算成功率达99.99%,运维响应时效从小时级压缩至17秒,大幅降低运维成本与压力。
openFuyao助力千行万业构筑高性能、高安全、高可用容器平台
广电五舟自研算力容器平台PentaPleiades的成功实践,是openFuyao技术底座赋能行业场景的典型范例,打破资源桎梏、简化操作流程、优化成本投入,让高性能计算更高效、更便捷、更经济。
目前,openFuyao社区首个LTS版本已上线,为企业级用户提供高性能、高安全、高可用的AI云原生容器平台,欢迎下载体验:
https://www.openfuyao.cn/zh/download/

诚邀更多企业、科研机构、高校及开发者加入openFuyao社区,共同探索算力极致释放新路径,共建多样化算力集群软件繁荣生态,携手释放智能无限价值!