智算时代的基础设施如何实现可继承可演进?浪潮云海发布 InCloud OS V8 新一代架构平台

从 2023 年开始持续火爆的 AIGC 正在加速落地应用,为全行业带来生产生活效率的变革与升级。面对数字化转型与智能化转型,对于技术团队来说,既要根据业务与 AI 应用去部署以云为基础的 AI 算力,又要与已有数据和系统(甚至是遗留的虚拟机环境)协同去发挥和实现 AI 价值,这其中的异构算力、复杂的工程化工作,可能反而会造成新的烟囱式系统,以及 AI 算力资源的浪费。此外,运维团队面临"新旧相融"的难题,即新旧应用无法平滑衔接、统一管理,新旧IT资产无法无缝相容、统一调度。

更加灵活的智算时代,云基础设施需要可继承、可演进

当前很多企业的云平台采用IaaS、PaaS和SaaS紧耦合的架构,各模块之间难以解耦,设备微调就必须从上至下重新适配,牵一发而动全身,无法快速响应新技术的演进升级。

针对时下 AI 大模型爆发,对基础设施算力性能、灵活性以及成本的需求,浪潮云海提出了"可继承、可演进"的私有云理念。其中可继承即私有云建设要能够继承过去的 IT 资产和运维能力,包括客户数据中心的硬件、软件等大量基础设施,长年累月的信息化和数字化投资等资产,还包括知识经验、人员组织和流程体系等IT 运维能力。

而可演进即面向日趋增强的技术不确定性,私有云要具备持续进化的能力,以满足日益增长的创新应用需求。架构可演进,指云平台整体框架具备升级、演进的能力。从提供基础的虚拟机、存储、网络服务到全栈服务(数据库、中间件、大数据、AI 等);从最小 3 节点小规模平滑扩容到大规模;从单中心扩大到多中心统一管理(多分支统一管理、云边协同);从单一 CPU 架构扩展到多 CPU 架构,从通用算力扩展到 AI 算力等。能力可演进,指人和组织能力的演进。业务应用层面,从传统架构到微服务、云原生架构演进;运维能力从传统的人肉运维,到半自动、全自动 AIops 运维;业务可靠性从单点单中心可靠,到多中心高可靠。

具体从存储、计算、服务、应用四层来说,具备可演进能力的私有云需要具备三大特征:分层解耦、开放标准和一云多芯,可以实现在异构算力需求下各层可形成共识标准,并独立演进迭代。具体来说:

一、在存储层,实现多协议融合,广泛兼容 ISCSI、iSER、NVME over RoCE、FC、FC-NVMe 等主流存储协议,实现各主流品牌存储的兼容利旧;业务创新,支持同品牌或不同品牌、集中式存储或分布式存储间的跨站点容灾。

二、在计算层的一云多芯,充分考虑底层算力设施框架的灵活性,同时支持多类型计算资源,不同的应用匹配不同的计算资源。另外跨算力共享的存储池和网络池,减少网络转发路径,降低建设成本与维护成本。

三、在服务层,浪潮数据云计算方案总监刘健表示,在实际数据中心部署中,行业云中 IaaS 层已分层解耦,但 PaaS 层仍有被云厂商或应用提供商锁定的情况。浪潮云海提出服务层分层共建,其中 PaaS 层通用能力下沉,以容器技术为核心构建敏捷的云原生 iPaaS 底座,满足服务标准化、多样性需求。另外联合共建个性化的能力,个性化能力可以上移,强行业属性的应用交给专业公司共建,实现一云多库、一云多服。

四、在应用层则是开放生态的技术框架和理念,从规划、到方案、集成、交付、售后,全面联合各类生态伙伴,实现行业数字化转型。

浪潮云海 InCloud OS V8 新一代架构平台,实现 IT 资源可继承、可演进

基于可继承可演进的核心理念,浪潮云海发布了新一代架构平台------InCloud OS V8,其产品能力与四层可参考架构一一对应,支撑可演进需求:

  • 存储层:文件系统,存储多协议,支持 NVMe-OF,支持 ISCSI,支持私有协议、容灾、备份、安全等,屏蔽底层存储;
  • 计算层:一云多芯管理、等价算力调度、AI 智算能力、算力标准化、资源可扩展性;
  • 服务层:1、对底层资源的便捷供给,2、工具化能力,在云平台上基于标准模板发布 PaaS 服务,快速嵌入云平台,3、上层管理平台,对日志、监控、运维、用户统一管理;
  • 应用层:则是以第三方伙伴服务为主。

浪潮云海根据服务客户的实践经验,总结形成了分布式云、容灾备份、安全云、云替换、智算中心、云原生六大场景解决方案,基本满足了各类应用场景对底层基础设施的需求。具体来看,

  1. 分布式云解决方案:面向多分支机构场景,满足多级云(省市多级云、集团分支多级云)、异构云、多厂商云、云边(中心云、边缘云)统一管理需求。
  2. 容灾备份解决方案:面向两地三中心场景,满足客户业务对高可靠的要求,可提供本地备份、同城双活、异地灾备等服务。
  3. 安全云解决方案:面向安全合规场景,提供满足各类安全测评标准的服务套餐。
  4. 云替换解决方案:为 VMware 替换、公有云下云等场景提供跨云迁移方案。
  5. 智算中心解决方案:面向智算中心场景,提供 GPU 整机租赁、AI 开发、AI 训练、大数据等服务,支撑智算中心算力运营。打造从基础设施、算法工具、智能平台到模型服务的 AI 赋能产业生态
  6. 云原生解决方案:面向以容器技术为支撑的云原生创新应用场景提供开发测试、微服务治理、DevOps 解决方案,方便业务云原生转型,是推动企业数字化转型的最佳工具。

从大模型落地带来实效,到多元算力需求下智算基础设施的发展,智算时代正在真实到来。灵活、高效的算力资源,将是一切智能化发展的基础,CSDN 将持续关注智算技术领域的最新资讯。

相关推荐
工业互联网最前线23 天前
尚航科技受邀出席腾讯全球数字生态大会,并重磅发布云智算中心共建计划
大数据·ai·腾讯云·数字化·智算中心
UsamaBinLaden1 个月前
Apache CloudStack Official Document 翻译节选(十三)
云计算·apache·cloudstack·私有云
网安加社区1 个月前
网安新声 | 网易云音乐崩了:网络安全如何守护在线体验
数据安全·基础设施
happy_king_zi2 个月前
搭建高可用OpenStack(Queen版)集群(二)之部署控制节点高可用的管理支持服务
openstack·虚拟化·私有云·超融合
FISCO_BCOS3 个月前
【区块链+基础设施】银联云区块链服务 | FISCO BCOS应用案例
区块链·基础设施·银联云
FISCO_BCOS3 个月前
【区块链+基础设施】区块链服务网络 BSN | FISCO BCOS应用案例
区块链·fisco bcos·基础设施·bsn
tiandizhiguai4 个月前
DHorse v1.5.1 发布,基于 k8s 的发布平台
k8s·云架构·微服务架构·私有云·公有云
阿川20154 个月前
在大模型AI的下一个战场,为中小创新企业重构竞争格局
人工智能·大模型·智算中心
Seal软件5 个月前
不谈虚的,平台即产品真的有那么好吗?
团队开发·平台工程·基础设施·paap
G皮T6 个月前
【云计算】混合云分类
分类·云计算·私有云·公有云·混合云·同构混合云·异构混合云