拥有600+门店的宠物连锁医院,实现核心业务系统上云

瑞派宠物医院管理股份有限公司(以下简称"瑞派宠物")从2017年开始数字化转型之路。瑞派宠物在全国有600+连锁门店,随着业务量增加,线下部署的财务系统存在设备老旧、机房环境差等问题,部分在公有云上的业务,安全防护问题也令人担忧。种种因素叠加,瑞派宠物开始规划一条创新的云化转型之路。

瑞派宠物目前的IT基础设备由两部分组成,一部分是本地机房,另一部分则是采用某公有云承载的云端服务。随着公司业务的快速发展,现有的以公有云共享区形式提供的云服务,已不能满足医院数据独享可控的需要,因此需要选择更适配的云服务模式进行业务承载。瑞派宠物面临的主要挑战如下:

  • 线下部署的财务系统因设备老旧、机房环境差导致问题频发,但因为涉及敏感数据,财务部门出于安全考虑,对于上公有云较为担忧。
  • 为了保障用户的信息安全,预计在安全防护上投入会越来越大,采用市面上其他云服务的部分安全组件,价格高昂。
  • 公有云模式下,只提供安全工具式的方式并不能解决传统安全的威胁,而业务运行在公有云的共享区,使得上面任意一个虚拟机逃逸,都可能威胁到其他用户的资产,大量的服务资源也可能因为配置错误导致直接暴露到公网,存在很大的安全隐患。
  • 自建私有云TCO成本居高不下,建设周期和人员制度的磨合期也对业务上线与稳定运行提出了更高的挑战。

其中,瑞派宠物对于财务系统的数字化升级尤为看重。财务系统的升级,可提高财务管理水平、优化业务流程、降低成本、支持企业决策等,并且可以通过集成的财务管理模块,帮助用户实现财务数据的自动化处理、数据分析和决策支持,满足不同行业的特殊需求。

财务系统如果发生故障,将导致较为严重的问题,在对比了市面上的各类产品及方案后,瑞派宠物决定采用深信服托管云------既具备公有云的资源弹性伸缩、资源在线化、服务化交付的特点,也具备私有云一样的专属资源物理隔离的特点,可满足瑞派宠物的上云需求。

一、托管云技术方案,支撑数字化升级

托管云整体方案架构

基于瑞派宠物医院的现有资源和新建资源需求,本次方案设计采用托管私有云方式设计,机房节点选择为天津一区节点,资源集群独享,以产品+服务的方式进行建设。同时专属托管私有云支持按年灵活计费,若后期需求变动可对资源以年为周期、按照节点数进行动态弹性伸缩,灵活应对医院后续业务需求。除此之外,还一站式提供等保三级所需的安全服务组件及配套的安全运营服务。

资源规划设计

深信服从性能、接入可靠性、安全等方面对用户财务系统进行了详细的设计,以确保业务的安全性和性能。

针对用户财务部门对上云安全性的担忧与质疑,托管云提供了端到端的安全防护措施,涵盖网络层、主机层和数据层。通过部署丰富的安全产品,实现全流程的安全防护,确保数据的完整性和保密性。此外还提供了安全托管服务MSS(Managed Security Services),为最终的安全效果负责。

在性能优化方面,托管云根据用户的业务负载特性,将其中WEB和WEB-API1/2作为前端接入层,负责请求的路由分发。在高峰时段,这些服务需要处理来自全国600多家连锁门店的并发请求,对CPU和内存资源的需求极高。为了应对这一挑战,方案配置了多种规格的虚拟机,包括4核/16GB、22核/44GB、16核/32GB和8核/16GB,以确保系统的稳定运行和响应速度。

对于财务系统业务的数据持久层,包括DB、File,它们都承担着大量的数据存储任务,特别是对于DB数据库,配置2.78TB的全闪存存储和32核/128GB的高性能虚拟机,以满足业务对性能和存储的严格要求。

经过以上设计,托管云的方案最终可支撑全国600+门店的100+业务人员同时在线操作的需求,并确保平均每4小时能处理4000至12000笔交易指令。

具体的业务规格配置如下:

这种高性能、高安全性的架构设计,大幅提升了业务的安全性和可用性,还解决了用户原先线下部署机房空间限制和弹性扩容能力不足导致的性能瓶颈问题。

更重要的是,托管云方案解决了在公有云共享环境中部署敏感业务时遇到的安全、数据主权、资源专属问题,确保了业务的连续性和数据的安全性,为用户提供了一个既安全又高效的业务环境。

除了提供的全闪卷以外,还配置了42T混合块存储,和单独提供8192GB的外网对象存储服务,500G的NAS文件存储服务,4000GB的数据备份服务。

在备份策略设计上,每小时备份一次,并且保留七天。

网络接入设计

  • 在财务业务网络接入设计方面:

首先确保连接的安全性,同时兼顾网络链路的高可用性和用户使用习惯的保留。针对用户原先通过自建IPsec-VPN方式进行访问的使用习惯,在托管云侧配置了即插即用的托管VPN安全服务,以满足用户的安全需求。

为了支持最多100个业务人员同时在线操作的需求,并确保平均每4小时能处理4000至12000笔交易指令,专门设计主备双线路50MBps的带宽,以保障业务的高效运行。

  • 在高可用性设计方面:

采用多线路主备策略,确保多条线路互为备份,以维持可靠运行。若任何一条线路出现故障,深信服托管VPN服务能够无缝切换数据至其他正常线路,不影响SSL VPN用户的接入和访问。断线重播功能通过ADSL实现,确保在VPN连接中断时能够迅速恢复。

在VPN本身的高可用性方面,采用了主备架构,实现了主备节点之间的Session同步,确保多台设备能够即时同时更新用户信息。在主节点出现故障时,3秒内即可恢复服务,并将服务中的用户无缝迁移至其他设备,从而确保设备的意外事故不会给用户的业务访问带来负面影响。

安全设计

本次安全建设的主要目标是等保合规建设及面向安全威胁的防护,在等保合规建设方面提供了一站式等保合规建设,包括等保组件的配置、配合用户进行等保整改等,让用户的业务系统快速过等保。

首先在安全产品组合上,针对访问层、主机层、数据层特别是面向勒索病毒等安全威胁,都配置了专业的安全产品,做到端到端的安全防护措施。

其次,通过安全托管服务MSS,以"人机共智"模式为手段,7*24小时在线值守,提前预防好所有的安全隐患,发现安全威胁最快30分钟以内响应,保障包括财务系统在内总计1005个资产的安全兜底,为最终的安全效果负责,从而彻底消除用户对财务数据上云的安全担忧。

业务迁移

在进行用户业务上云迁移的过程中,确保IP地址变更后的互访正常和降低停机时间是两个核心考虑点:

  • 业务互访保障:由于业务上云涉及到IP地址的重新规划,首要任务是确保迁移后业务系统之间的互访不受影响。
  • 降低停机时间:为了最小化业务迁移过程中的停机时间,采取将业务系统分4批进行迁移,每批迁移前进行测试和准备工作,确保尽可能快速且不影响现有业务运行。数据库方面,利用实时数据同步DTS进行全量和增量进行迁移,进一步减少停机时间。

在本次业务迁移项目中,针对IP地址变更及业务互访问题,采取了以下措施以确保业务的连续性和稳定性:

  • 业务互访保障:由于涉及业务系统改造和IP地址的重新规划,深信服与用户业务相关方进行了深入的沟通和协作。用户业务相关方负责梳理各业务系统间的接口调用关系,深信服作为网络规划方,负责整体网络的规划和打通工作,以确保迁移前后的网络连通性。
  • 业务配置文件的修改与重配置:在迁移后,用户业务相关方负责业务配置文件的修改和重配置工作,以适应新的网络结构。

针对业务迁移期间的停机问题,采取了以下两种策略来确保停机时间控制在30分钟以内,以最小化对医院日常运营的影响:

  • 时间选择:与用户协商,将停机时间安排在晚上和周末,这些时段医院业务相对较少,从而最大程度减少对用户服务的影响。
  • 迁移策略:
    逐步迁移:采用分阶段迁移的方法,先迁移非核心业务,再逐步过渡到核心业务,确保在任何时候都有最少的服务中断。
    并行运行:在迁移后,新旧系统将并行运行一段时间,以确保在新系统完全稳定之前,旧系统仍然可以提供服务。

业务运行情况

项目在一期阶段通过3台aSever-2305服务器组件独立的私有云集群,单台服务器可提供的计算资源如下:大内存型(202核/470G/14T)(3台*12月);内存资源升级服务(2X64G),总共可提供808核、1922G内存、42T块存储空间。随着用户业务的发展,又分别进行了第二期和第三期的扩容。目前,累计可提供的资源包括2680个vCPU和7004GB内存,以满足瑞派宠物不断增长的计算和存储需求。

当前,用户的财务系统和财务共享平台已在托管云上稳定运行,各项业务表现正常。上云后,财务系统的整体使用效果显著提升。原先VPN频繁掉线的问题,通过部署深信服SSL VPN并采用多线接入及主备方式得到彻底解决。

同时,性能瓶颈导致的应用进程卡慢和死机问题,在迁移至托管云并配置高性能云主机与全闪存卷之后,也得到了有效缓解。以处理交易订单为例,财务系统在托管云环境中每4小时能处理的交易指令数量达到4000至12000笔,相比以往有显著提升,并且可以根据性能曲线进行实时灵活调整。

截止至目前,瑞派宠物的业务在托管云上已平稳运行超过550天,期间未出现任何重大故障与报错。

相关推荐
天翼云开发者社区15 小时前
使用 Rust 实现的基础的List 和 Watch 机制
rust·云计算
AKAMAI1 天前
跳过复杂环节:Akamai应用平台让Kubernetes生产就绪——现已正式发布
人工智能·云原生·云计算
天翼云开发者社区1 天前
Rust 中的 Tokio 线程同步机制
云计算
天翼云开发者社区1 天前
亮相2025年服贸会,天翼云打造高质量算力服务新生态!
云计算·天翼云
容器魔方3 天前
Bloomberg 正式加入 Karmada 用户组!
云原生·容器·云计算
AKAMAI4 天前
Sport Network 凭借 Akamai 实现卓越成就
人工智能·云原生·云计算
10岁的博客4 天前
《云计算如何驱动企业数字化转型:关键技术与实践案例》
云计算
m0_694845575 天前
教你使用服务器如何搭建数据库
linux·运维·服务器·数据库·云计算
shinelord明5 天前
【数据行业发展】可信数据空间~数据价值的新型基础设施
大数据·架构·云计算·创业创新
XINVRY-FPGA5 天前
XCKU15P-2FFVA1760I AMD 赛灵思 Xilinx Kintex UltraScale+ FPGA
arm开发·嵌入式硬件·阿里云·fpga开发·云计算·硬件工程·fpga