金融数据中心容灾“大咖说” | 英方软件的“分而治之”之道

中国人民银行发布的《金融数据中心容灾建设指引》(JR/T 0264---2024)已于2024年7月29日正式实施。这一金融行业标准对金融数据中心容灾建设中的"组织保障、需求分析、体系规划、建设要求、运维管理"进行了规范和指导。面对不断增加的各类网络、业务、应用和数据风险,金融机构究竟该如何更好地规划、建设、运维其容灾系统,实现长期可持续发展的战略目标呢?

下面,就让我们听听业界的"大咖"们都怎样说......

作为国家的经济命脉,银行、证券等金融机构对数据零丢失和业务连续性的要求在各行各业中是最高的。银行信息系统架构最为严格,要求采用两地三中心或主备等多种模式构建灾备系统;各大券商的灾备中心的架构通常采用虚拟化技术,实现生产端物理机与虚拟机并存、灾备端以虚拟机为主的配置。

近年来,随着云化、国产化浪潮的深入发展,金融行业的灾备建设日益展现出多样性、复杂性和规模化的特点。面对这些新变化,金融行业对灾备系统的需求也在不断更新与提升,主要表现在:海量数据备份与实时复制;数据库数据跨平台迁移和读写分离;主备业务系统应用高可用;提升灾备中心智能运维水平;大规模灾备系统可用性验证的自动化能力等。

容灾建设面临三大关键挑战

在数智化时代,金融行业容灾建设展现出哪些新的趋势?又面临哪些挑战呢?

首先是灾备体系建设成本高昂。 金融行业灾备体系的建设需要投入大量资金,包括技术设备、人力资源和运维成本等。对于部分中小型金融机构来说,成本压力较大。因此,金融机构需要制定合理的灾备建设预算,优化资源配置,降低灾备建设成本。

其次是数据安全和隐私保护的挑战。 金融行业的业务数据涉及客户隐私和国家金融安全,如何在灾备过程中确保数据安全和隐私保护,是金融行业灾备建设面临的一大挑战。因此,金融机构需要不断跟进新技术的发展,在积极采用新技术手段提高灾备效率的同时,还要保证数据的安全性。

最后是灾备资源配置不均衡。 金融行业的灾备资源分布不均衡,一些金融机构的灾备能力较强,而一些中小金融机构的灾备能力较弱,这在一定程度上影响了金融行业的整体灾备能力。因此,上级监管单位需建立完善、合理的管理机制和流程,确保灾备建设的顺利实施和有效运行。

风险分析先行

金融领域由于对安全性的要求非常高,因此灾备建设的各项要求也非常严格,任何系统宕机、网络攻击、停电等所导致的数据丢失与业务中断,都可能给用户带来严重损失。为此,金融行业的灾备建设要求RPO与RTO尽可能接近于0。

从灾备服务商的角度来看,方案设计架构一般包括以下三个层面。

应用层 根据业务等级,将应用系统划分为不同等级。本地数据中心可采用双机热备方式或集群方式,实现本地高可用保护。当然,云端高可用也可以考虑,但需要考虑到云端业务如何切换、IP如何漂移等问题。

网络层 网络层的设计尤为关键,网络通则一切通。云灾备会涉及云和云之间的数据复制链路和IP网络传输链路问题;对于一些综合性平台,还需要考虑分支机构、审计机构的网络接入问题。

数据层 在数据层,可依据恢复优先等级采用不同的数据保护方式和云灾备规划。如果是冷数据的话,公有云是可以接受的,比如数据的冷存储场景,云上的成本已经可以做到低于本地磁带存储,并且可以实现完全托管以及在12 小时或更短的时间内恢复数据。

上述层级分类与《指引》中提到的生产系统风险分析、基础设施风险分析、业务影响分析相对应。全面的风险分析将有助于金融机构充分了解自己面临的安全隐患。

在《指引》中,提出将容灾体系分为同城容灾、异地容灾和极端容灾3个层次,并且给出了具体适用的场景。

金融机构的灾备需求主要根据机构系统的重要程度划分。由于涉及的子系统太多,根据英方软件的实践经验,一般将其划分为关键业务、核心业务以及普通业务三类。一般情况下,关键及核心业务系统会采用热备模式、多活方式保证高可用,给予业务系统多重保障;非核心业务系统可采用冷备模式、定时或实时备份数据,以及数据恢复和业务高可用切换接管等。

对于灾备等级要求高的金融机构,也需要远距离异地容灾、两地三中心等灾备模式。针对金融行业细分领域对安全等级的不同要求,以及不同客户生产环境存在的差异化,灾备解决方案也会有所不同,一般包括:两地三中心及异地多活、同城灾备、两地三中心容灾、同城高可用+异地灾备、同城数据同步+异地容灾等。

具体来说,国有大型银行与商业银行在规模、业务复杂性和数据重要性等方面存在差异,因此适用的容灾模式和方式也会有所不同。具体来看,大型银行通常拥有更为复杂的业务系统和庞大的数据量,因此更倾向于采用高级的容灾技术,如异地多活、数据实时同步等,以确保在灾难发生时能够迅速恢复业务运行。而规模较小的商业银行则可能更注重成本效益,可选择相对简单的容灾方案,如数据定时备份和恢复等。

持续创新 "因地制宜 因人而异"

基于完善的产品矩阵和解决方案,英方软件可服务银行业、保险业、信托业、证券业等各类金融用户,并拥有广泛的成功实践。

针对等不同业务级别的差异化灾备需求,英方软件提出分层分级的保护策略:对于一级关键业务,实施定时与实时并重的备份机制,并强化容灾建设,确保业务连续性万无一失;二级核心业务侧重于定时与实时备份的灵活组合,以应对中高风险场景;对于三级普通业务,可采取高效经济的定时备份方案,实现成本效益的最优化。

概括而言,英方软件可提供包括HA应用高可用、CDP数据持续保护、CDM数据副本保护等在内的多项技术能力,以及容灾资源一体化管理、数据定时备份及异地保护、整机异构平台迁移、整机异构平台迁移、数据库复制、企业文档管理从合规、协作到AI赋能等产品,还有同城交易系统灾备、证券自营资管系统两地三中心、证券资产管理系统------同城高可用、异地灾备等一系列定制化场景解决方案,助力用户实现数据保护的精细化分层与无缝升级。

因为金融机构的业务系统非常丰富,日常管理和运维成本需要一套智能化、统一的平台进行管理。容灾系统在金融业务的运维体系中,起到了安全支撑作用,目前还是比较独立地运行。未来,随着业务体系的容灾规模增大,容灾管理平台将实现全灾备系统的统一可视化管理,即通过全流程化的指挥管理、资源管理、预案管理及平台管理,结合平台可视化的容灾流程编排和灾难恢复国家标准,对整个应急切换、容灾演练进行全程实时监控,利用决策级的大屏界面展示容灾的关联资源,科学把握和推进容灾切换进度,让管理员准确、快速地指挥决策。

当前,人工智能技术已经被用于容灾系统的建设及运维。从容灾、备份到云灾备与大数据管理,英方软件围绕AI新的生态应用场景,助力用户实现全域数据的无缝、高效流动,让高质量数据为AI赋能,并构建起一套高效、精准和智能的数据保护与管理体系。

通过先进的数据复制保护技术和产品方案,英方软件实现了产品从AI基础设施层到应用层的数据连接与灾备守护,确保了数据在流动中的安全性、完整性和可用性。无论是云计算环境的灵活迁移,还是大数据平台的深度整合,亦或是AI模型训练与推理过程中的数据支撑,英方软件都能提供高效的数据管理方案,助力用户跨越数据孤岛,加速数据的流通、共享和交换。

目前,英方软件的容灾解决方案已在全球银行业落地实施,包括国内的中国工商银行、中国建设银行、上海银行、浦发银行、华夏银行、苏州银行、国家开发银行、中国人民银行某省分行等国有股份制银行、股份制银行、城市银行、地方城商行,以及Disha Bank、Royal Exchange等海外金融机构。

某大型保险企业成功实施了从多源虚拟化资源池(包括VMware、HCS、CAS及OpenStack等)向信创虚拟化平台的全面无代理迁移。在确保业务不间断运行的同时,实现了数据的无缝迁移与复制,有效避免了传统迁移方法可能带来的复杂性与风险。迁移过程中,无代理方案减少了对原系统的干扰,提升了迁移效率与成功率,确保了迁移过程的高效与安全。此外,项目还增强了该保险公司在异地的虚拟机复制与迁移能力,构建了自主可控的容灾体系,进一步提升了业务连续性与数据安全性。

某国有券商开展了智能备份中心建设,不仅实现了传统备份体系与信创技术的深度融合联动,构建起跨平台的灵活备份与恢复机制,还通过前沿的动态资源调度技术,实现了资源的最优化配置与集约化管理。在虚拟化平台层面,该智能备份云中心展现出卓越的深度融合能力,能够在灾备模式下精准控制资源分配,确保最小资源占用,并有效降低了运营成本。当需要切换至生产模式时,系统能够自动完成资源的快速扩容,确保业务的无缝衔接与高效运行。

《指引》为容灾建设指明方向

英方软件认为,《指引》的发布为金融行业数据中心的容灾建设提供了明确的指导和规范,将有助于提高金融行业数据中心的容灾能力和水平。具体来说,《指引》明确了容灾建设的目标、原则、技术要求和实施步骤,为金融行业用户提供了科学的容灾建设框架。同时,《指引》还强调了容灾建设的持续性和有效性,要求金融行业用户不断完善和优化容灾方案,确保在灾难发生时能够迅速恢复业务运行。

《指引》中特别值得金融用户和容灾方案提供商注意的内容主要包括以下三个方面。

容灾等级划分 《指引》根据金融业务的重要性和数据丢失的容忍度,对容灾等级进行了明确划分,这有助于金融用户根据自身业务需求选择合适的容灾方案。

技术要求和实施步骤 《指引》详细列出了容灾建设的技术要求和实施步骤,包括数据备份、恢复策略、灾难演练等方面,为容灾方案提供商提供了明确的建设指引。

持续性和有效性 《指引》强调了容灾建设的持续性和有效性,要求金融行业用户定期评估和优化容灾方案,确保容灾系统能够持续有效地发挥作用。

随着市场竞争的加剧和监管要求的提高,各类金融机构普遍认识到灾备建设的重要性,已将灾备建设纳入战略规划,并投入大量资源进行建设。除了传统的物理备份、磁带备份外,金融机构正积极采用云备份、虚拟化备份等新技术手段,提高灾备效率和可靠性。未来,金融机构应在灾备建设方面严格遵循统一的规范和标准,提高灾备建设的规范性和可操作性。

往/期/回/顾

从科技赋能到价值引领,东莞证券可进化的信创云建设启示录"智算"雄起 | 智算操作系统要"顶天立地"

<>金融数据中心容灾,你做对了吗?

<>英方软件:Data+引领数据复制的下一个十年

<>十年,英方软件的变与不变

相关推荐
金融OG1 小时前
99.11 金融难点通俗解释:净资产收益率(ROE)VS投资资本回报率(ROIC)VS总资产收益率(ROA)
大数据·python·算法·机器学习·金融
cmgdxrz1 天前
金融项目实战 07|Python实现接口自动化——连接数据库和数据清洗、测试报告、持续集成
自动化测试·金融·pymysql·jenkin
金融OG1 天前
99.8 金融难点通俗解释:净资产收益率(ROE)
大数据·python·线性代数·机器学习·数学建模·金融·矩阵
Damon小智1 天前
全面评测 DOCA 开发环境下的 DPU:性能表现、机器学习与金融高频交易下的计算能力分析
人工智能·机器学习·金融·边缘计算·nvidia·dpu·doca
阿正的梦工坊2 天前
使用ChatGPT写一本书《美国金融市场发展史(英文版)》:Chapter 09 The Future of U.S. Financial Markets
金融·英语
金融OG2 天前
5. 马科维茨资产组合模型+AI金融智能体(qwen-max)识别政策意图方案(理论+Python实战)
大数据·人工智能·python·线性代数·机器学习·金融
deephub2 天前
金融波动率的多模型建模研究:GARCH族与HAR模型的Python实现与对比分析
开发语言·人工智能·python·机器学习·金融·波动率
Ai多利2 天前
2025发文新方向:AI+量化 人工智能与金融完美融合!
人工智能·ai·金融·量化
金融OG2 天前
99.12 金融难点通俗解释:毛利率
python·算法·机器学习·数学建模·金融
野马财经2 天前
Decode Global专注金融创新,构建便捷的交易平台
大数据·人工智能·金融