1500台
大规模容灾
跨云容灾
更安全,可扩展
优化灾备TCO
无主机同步技术,优化成本

一、背景

 

2023年8月,一所国家级社会保障机构的数据中心突发电力中断,致使业务系统停摆近1天,影响医院等医疗机构正常运作,威胁着百万民众的医疗健康与社保服务。
作为所在地区最大的社会保障机构之一,该机构为数百万民众提供医疗、社保、健康管理等服务,其数据庞大、业务复杂、业务连续性要求极高。此次停电使其意识到本地IDC灾备方案在恢复能力和速度上存在的局限。为避免业务中断再次发生,确保在突发状况下迅速恢复的同时兼顾相关法规合规,该机构计划短期内将本地Huawei Cloud Stack(HCS)私有云平台的业务系统容灾至华为公有云平台。

 

二、面临的挑战

 

1.合规压力下的云灾备转型

该机构作为医疗健康与社会保障核心枢纽,需要满足严格的RPO和RTO合规要求。比如,医疗系统必须要确保电子健康记录(EHR)的安全,避免数据丢失以保护患者隐私;作为社会经济关键基础设施,应该重视恢复时间目标(RTO)和数据保护的重要性,减少公众信任危机。为此,该机构亟需借助公有云平台的容灾恢复能力。


2.大规模、复杂环境推高容灾成本

此次容灾计划涉及至少1000+台虚拟机,且运行环境复杂,包括7个版本的Windows主机和11个版本的Linux主机。这种大规模和多样性,使得传统灾备方案的建设和维护成本高昂且难以控制。该机构需要引入自动化部署和运维管理容灾方案,来降低容灾成本并提升效率。


3.单一架构,难以应对新型挑战和技术创新
该机构的业务需求在数字化转型和公共服务创新的驱动下不断变化,目前的私有云平台难以快速适应新的业务场景或需求变化。例如,在短时间内难以提供足够的扩展能力,需要提前规划和手动配置,难以应对突发公共服务负载激增或新型网络攻击等,严重制约业务敏捷性与创新能力。

 

三、解决方案


1.差异化的数据同步策略,精准匹配保护
该机构的业务系统涵盖多个领域,各系统对数据一致性要求差异显著。为此,万博智云团队通过HyperBDR云容灾实施了差异化的增量同步策略,确保每一类系统获得与其重要性相匹配的保护级别:
业务连续性要求极高的系统:如癌症患者管理应用(医疗健康类)、收费系统(财务与经济类)等系统,采取每5分钟增量同步的策略,RPO为5分钟。
数据一致性要求高的系统:像数字化健康证系统(医疗健康类)等系统,每1小时增量同步,RPO为1小时。
中等重要的系统:如监控和告警管理系统(技术支持与运维类),每12小时增量同步,RPO为12小时。
次要或非实时需求的系统:如公共工程信息和跟踪系统(公共服务类),每24小时增量同步或按周、月完整同步,RPO为24小时及以上……
通过以上差异化策略,HyperBDR确保该机构的核心业务系统获得了低至5分钟的RPO保护,同时为非关键系统提供了适度的容灾支持,避免了资源浪费,实现了保护级别与业务价值的精准匹配。

2.Boot in Cloud技术,一键云上启动业务
HyperBDR的Boot in Cloud技术通过与华为云侧API的无缝对接,灾难发生时系统能按预设策略和自动化指令,一键启动云侧资源,在10 - 15分钟内拉起多个业务主机,并迅速恢复到操作系统登录页面,显著缩短恢复时间,满足该机构 RTO 30分钟的合规性指标。


3.并发传输与自动化实施,提高部署效率
综合源端和目标存储系统I/O性能、网络带宽等因素,1000+台虚拟机的首次全量数据同步被安排每天40 - 50台并发完成;同时在客户同意前提下配置了Agent自动化安装脚本,快速完成了全部主机Agent安装。其中,500台Windows系统的安装只用了2个半小时,另外500台Linux系统因系统内核类型较多,适配和处理的时间较长,不过也在近2个工作日内完成。整体周期从15+天缩短至2个工作日内,提升了部署效率并降低了复杂性。


4.云深度集成,构建跨云韧性
HyperBDR通过与云原生能力的深度集成,为该机构实现跨云环境下的弹性资源调度与资源编排能力,动态适配突发公共服务负载、新型网络威胁及政策技术变革,确保该机构始终维持业务连续性;同时,基于可视化的统一管理以及对自动化脚本的支持,为该机构提供了更为高效简单的跨云保护,实现私有云到公有云的无忧、无缝容灾​。

 

四、价值收益

 

通过采用HyperBDR云容灾解决方案,该机构成功实现了本地数据中心到公有云的灾备计划,最大限度降低服务中断风险,为数百万民众的医疗和社保服务提供了坚实保障。具体价值体现在:


1. 业务韧性及合规保障显著增强,核心系统RPO达5分钟
该机构实现了30分钟的RTO(恢复时间目标)和5分钟的RPO(恢复点目标)的SLA要求。其中,最核心的系统在灾难发生时,能够确保数据丢失量控制在5分钟以内,其余系统也能在短时间内恢复到最近的有效数据状态。既保障了数据的一致性,也满足了政策对业务连续性和数据保护的高标准。


2. 灾备和运维成本显著降低,人力成本节省80%以上
借助自动化Agent安装脚本,该机构无需为每台虚拟机单独部署备份系统,容灾部署周期从15天大幅缩短至2天,人力成本节省达80%以上。另外,HyperBDR的无主机数据同步和全增量同步技术,有效降低了该机构的灾备存储成本。相比传统容灾方案,存储成本降低了70%以上。


3. 适应未来,激活数字化引擎
该机构借助HyperBDR的跨云保护能力,不仅夯实了当前业务连续性基础,更以 ​“适应未来”的弹性架构,抢占数字化转型先机,保障公共服务高可用的同时,为驱动创新应用落地打下基础,从容灾架构升级开始,为业务创新启动“引擎”。具体表现为:

a.资源灵活调度与按需扩展
该机构的容灾架构能够保证在突发公共服务负载增加的情况下,系统能够从公有云侧动态调整资源分配,实现业务需求的快速响应,确保服务不中断。
b.数据的管理、分析与智能转型
该机构可以更加高效地管理和充分利用备份数据进行数据分析,引入AI深度学习和训练推理,开展业务优化、风险预测、医疗健康以及社会保障趋势分析等工作,推动智慧医疗健康和社会保障服务转型等。

 

 

五、结语


HyperBDR基于云原生深度集成,以差异化数据同步、一键云上恢复、自动化高效部署为该机构构建了跨云保护能力,提升了业务韧性。更为重要的是,为其未来的数字化转型和创新场景埋下伏笔,令其逐步成长为公共服务领域数字化转型的先行者。
我们期望与更多公共部门合作,助其打造面向未来的,灵活、可靠、自动化的灾备体系。帮助他们在面对电力故障、自然灾害、网络攻击等突发事件时迅速恢复服务,提升其业务韧性和数据弹性,同时推动他们为数字化转型做好准备,让公共服务体系更加智能、敏捷,满足未来发展的需求。

案例描述
挑战:原有灾备系统部署复杂、运维负担重,难以适配快速变化的业务系统,缺乏灵活的云上恢复能力。
方案:采用HyperBDR实现核心系统的异地容灾,结合华为云资源实现云上恢复与资源弹性调度,极大简化灾备流程。
收益:系统具备分钟级恢复能力,灾备架构灵活可靠,大幅降低灾备总拥有成本,支持未来扩展至更多业务系统。
为您推荐

关于我们

万博智云,国内领先的智能基础架构解决方案提供商。基于异构AI算力与混合云的编排能力,为企业数字化转型提供精准高效的支撑平台。通过自主研发的智能调度引擎,构建覆盖算力编排、业务无感迁移、混合云容灾,多云成本优化等全栈解决方案。依托可进化的智能数字底座, 助力企业筑牢创新根基,在人工智能技术产业化与数字化能力升级中持续领跑行业。
www.oneprocloud.com.cn
准备开始试用我们的产品了吗
点击试用

内容推荐

HyperBDR云容灾深度解析六:云上演练效率高保障全,容灾资源用处多

容灾建设是系统安全运行保障体系的基础性工作,是保障业务连续性的必要手段,是适应当前IT建设和未来业务发展趋势的重大战略部署,是企业系统安全保障体系的重要组成部分。 容灾演练是IT服务业务连续性建设的重要工作内容。通过演练可检验应急响应和容灾体系的完整有效性,使相关人员了解信息系统应急响应及灾难恢复目标和流程;全面验证技术及业务管理指挥、流程操作、协调配合等方面的综合能力;完成灾难恢复相关人员意识和知识技能培训;验证应急响应及灾难恢复能力。  传统容灾演练方案&nbs

HyperBDR云容灾 3.6版本上线!

新功能目标平台:新增支持华为云HCSO平台新增支持Z-stack私有云平台 生产平台:新增AWS无代理功能,无需逐台主机安装代理,对生产系统无入侵,降低风险,同步降低部署工作量 产品优化UI优化:优化Windows Agent和Linux Agent的下载页面,丰富版本等信息

HyperBDR云容灾深度解析七:块级全量增量复制+对象存储——组合拳提升灾备效率,大幅降低容灾TCO

 数据复制决定备份容灾的效果   数据复制是将一组数据从一个数据源拷贝到一个或多个数据源的技术。数据复制经典的应用场景是备份和容灾。    备份是指对源数据形成一份同样的拷贝,存放至其它设备中。在发生自然灾害、软硬件故障、人为误操作等原因导致数据失效时,可通过恢复备份的方式重新找回失效数据。数据复制是数据备份的核心。备份数据的可用性依赖于数据复制的完整性和一致性。    &nb

万博HyperBDR云容灾软件V3顺利完成华为鲲鹏云兼容性测试认证!

鲲鹏技术认证证书最新消息,万博HyperBDR云容灾软件顺利完成华为鲲鹏云服务兼容性测试的认证,获得华为技术认证书。  万博云HyperBDR容灾软件企业级云原生全栈式容灾软件,统一纳管企业线下(本地端)和线上(云端)系统,实现跨平台/架构的完整保护和高速恢复。 云原生容灾以备份为核心,以迁移、恢复和高可靠为业务场景,实现多云之间的自由流转,最终满足用户的业务需求。万博智云的HyperBDR云原生容灾软件要解决三方面能力:一、以数据为核心,让数据在多云之间互相流转。

万博智云CTO孙琦出席第十一届中国云计算标准和应用大会,分享云迁移成本优化解决方案

2022年7月2日下午,万博智云CTO孙琦受邀出席第十一届中国云计算标准和应用大会,云迁移分论坛,和大家分享了《云迁移过程中成本分析和优化》的内容。 在分享过程中,孙琦提出了全新的广义云迁移的概念:    数据流转是广义云迁移的核心   在混合云早期时代,通过云管平台( Cloud Management Platform )能够完成对云资源的基本管理的需求,但是随着时间发展,业务数据在混合云之间的流动的需求逐步凸显。

容灾有疑问?点这里

01 1000台源端主机,怎么评估一下容灾所需的时间? 答:首先考虑前期调研时间、需要参考数据量的大小和源端读取数据的速度及目标端写入的速度,还有中间网络的传输速度。 02 数据传输中网络中断,应该如何处理?答:继续同步数据操作,网络中断后,云容灾平台的同步数据任务也会随之失败,待网络恢复后,可以在云容灾软件平台继续对迁移主机执行同步数据操作,会自动续接上次同步任务进行数据传输。  03 数据容灾保护是什么级别的?答:块级别,

关于云容灾,你需要知道这些

随着越来越多大型企业选择上云,IT基础设施的云化已迎来市场拐点。根据IDC发布的《全球云计算IT基础设施市场预测报告》显示:2020年第一季度,全球云IT基础设施投资占比已超过传统IT基础设施,达55.13%,这意味着以上云代表的新IT架构已经超越传统的旧IT架构,成为市场的主导者。 在数据爆炸中谋求数字化转型的中国企业越来越多,因为传统的平台往往难以支持广泛的数字化环境,支撑大量数字化的应用,企业将更多的数字化应用部署到了云平台上。为了保障企业的数据安全以及业务连续性,越来越多的企业

HyperBDR云容灾深度解析二:自研Boot in Cloud技术,实现高度自动化云容灾

企业客户在云容灾过程中,会遇到不同的难题:人力堆叠、技术门槛高、一个工具无法实现容灾的整个过程。这些问题都是容灾工具不够智能、自动化导致的。  HyperBDR云容灾以Boot in Cloud独家技术,实现高度自动化跨平台容灾。Boot in Cloud是HyperBDR的底层核心技术之一,类似一个核心引擎,驱动HyperBDR实现各种功能:多云编排,驱动智能适配,无需1:1预启动云端实例,一键云端拉起业务系统到可用状态,直接恢复到操作系统登录页面。1多云编排 A