业务需求
东亚银行(中国)有限公司需要在原有两地三中心容灾架构基础上,构建一个银行灾备自动化切换系统,让银行灾备中心替换生产中心的过程实现标准化、规范化、自动化,解决以往切换代价高、效率低、可靠性欠佳等问题。
一方面缩减灾备切换时长、避免停机、降低技术人员的技能要求,另一方面满足人民银行信息系统灾难恢复能力第6级对应的RTO为“数分钟”的指标要求,提升切换可靠性,最后要升级数据中心存储系统,实现业务生产效能的提升。
收益
· 满足灾难恢复能力第6级对应的RTO为“数分钟”的指标要求;
· 灾备操作自动化率达到75.38%;
· 灾备切换效率提升300%,操作人员数量减少了约60%;
· 升级核心存储实现产能升级,I/O性能提升500%;
东亚银行(中国)有限公司相关项目负责人表示:“灾备自动切换平台解决方案设计思路脱胎于戴尔科技集团咨询服务团队多年来的专业灾备实践经验,方案针对我们东亚银行的灾备切换、演练需求进行了专业化定制,并通过前期关联系统分析,确认切换的影响范围,将流程及操作步骤标准化为切换脚本,反复核对切换及回切操作手册,合理化切换流程,并在准生产环境中进行了10余次切换测试,以确保灾备环境可真实接管生产业务。”
按照中国人民银行《银行业信息系统灾难恢复管理规范》和银监会《商业银行业务连续性监管指引》等文件的要求,商业银行应当建立业务运营的监测体系及监控机制,及时、有效地响应运营中断事件,并及时启动应急预案,确保业务快速恢复,商业银行在实施应急处置时,应当采用程序化和标准化的手段,提高信息术应急处置的效率和质量。
在这种大背景下,东亚银行(中国)有限公司(以下简称“东亚银行”)与戴尔科技集团合作,引入Dell PowerStore 1000T和PowerMax 2000升级上海数据中心和深圳容灾中心存储平台,并依托业务连续性及容灾咨询服务,全面系统地完成了对当前灾备环境所存在问题的分析和总结,制定了应对策略及整改计划,全面提升了东亚银行的安全保障水平,在全面推进数字化转型的过程中,规避了发展过程中面对的潜在运维风险,在行业内树立了业务连续性建设的成功典范。
满足灾难恢复能力第6级对应的RTO为“数分钟”的指标要求
近年来,东亚银行的数字化程度越来越高,无论是集团业务还是零售业务,货币数字化、交易数字化、流程数字化早已成为主流。
为保障银行数字化业务的安全,东亚银行在上海和深圳以“两地三中心”的模式构建了生产数据中心和灾备数据中心,并承载了银行最为核心的关键业务系统,包括核心交易、资金管理、综合交易、客户管理、金融业务服务等系统,此前灾备系统还没有真实接管过生产业务,为此东亚银行选择了戴尔业务连续性及容灾咨询服务,对其灾备切换所面临的问题进行了细致的分析,并由戴尔科技集团的咨询团队给出灾备自动切换平台解决方案。
东亚银行(中国)有限公司相关项目负责人表示:“戴尔科技集团提供的容灾切换管理平台解决方案通过配置、执行、过程等多个维度的创新帮助我们东亚银行构建了出众的容灾自动化处理能力。在最初配置阶段做到了过程简易便捷,方案提供了可视化的配置界面和批量导入功能,降低了脚本配置复杂度。之后在执行过程中,做到了切换操作一键执行,无论是切换前准备、关联系统操作、检测APR记录,还是业务验证及恢复,系统可调度执行脚本一气呵成。在整个过程中,系统做到了切换进度实时展现,做到了操作过程有迹可循,提供切换和配置操作的历史记录查询功能,便于监管和审计的跟踪,完全满足行业监管要求,对此我们十分满意。”
具体来说,经过细致全面的分析,戴尔科技集团咨询团队总结出东亚银行灾备切换所面临的问题。
包括时效性差,切换时间过长,难以满足RTO指标要求;同时切换难度大,切换过程复杂,对人员的技能要求较高, 依赖IT人员对灾备切换的熟悉程度;如果进行灾备演练,成本也非常高,切换实战演练通常会涉及生产停机,会大幅增加生产运行风险;更为重要的是,切换执行结果和问题需要专人跟踪统计,这个切换过程无法实现有效监测。
面对灾备切换代价高、效率低、可靠性差等问题,戴尔科技集团提供了灾备自动切换平台解决方案(DRA),通过四大维度的创新帮助东亚银行构建了真正的容灾自动化处理能力。
第一个维度是配置,做到了配置过程“简易便捷”,系统提供了可视化的配置界面和批量导入功能,降低脚本配置复杂度。
第二个维度是执行,做到了切换操作“一键执行”,无论是切换前准备、关联系统操作、检测APR记录,还是业务验证及恢复,系统可调度执行脚本一气呵成。
第三个维度是切换,做到了切换进度“实时展现”。第四个维度是过程,做到了操作过程“有迹可循”,提供切换和配置操作的历史记录查询功能,便于监管和审计的跟踪,做到了满足灾难恢复能力第6级对应的RTO为“数分钟”的指标要求。
提升IT运维服务能力,灾备操作自动化率达到75.38%
与戴尔科技集团合作,东亚银行完成了灾备技术架构的优化,灾备自动化切换平台的上线、灾备日常运维体系及应急恢复体系的建设,真正具备了灾备日常运维和应急恢复的能力,满足了业务对IT运维服务在业务连续性领域的更高要求,降低了IT运维风险,使得东亚银行的IT整体运维服务能力上升到了一个新的台阶,大大降低了潜在的数据中心软硬件故障造成的业务风险,为东亚银行长期可持续发展提供了保障。
经过实践检验,东亚银行基于戴尔灾备自动化平台方案,总计65个切换步骤49个步骤实现自动化,灾备操作自动化率达75.38%。
灾备切换效率提升300%,减少了约60%的操作人员数量
按照中国银行业信息科技发展规划监管指导意见的要求,商业银行需要以保证金融业务平稳运行为目标,在灵活选择、调整和优化灾备架构的基础上,有效验证业务恢复流程可行性和资源可用性,有计划推进容灾切换演练,丰富演练场景和演练形式,提高演练真实性。
随着东亚银行IT环境的持续完善,传统的灾备切换(包括实战演练)模式对大多数IT人员来说,都是复杂而耗时的工作,具体表现在切换容灾指令下达后,IT团队无法实时跟踪接收及执行情况,灾难事件如果事发突然,部分关键人员可能未及时就位,人员依赖性过强,同时如果人员操作不熟练,慌乱中易出错,人为误操作将会造成二次损失。
更为关键的是东亚银行的切换系统众多、任务繁重,依赖部分技术骨干负责切换,任务无法并行执行,切换执行效率低。
为此,东亚银行引入戴尔容灾切换管理平台解决方案,方案内嵌灾备自动切换软件,适用于东亚银行大规模,多步骤的复杂灾备场景,通过软件平台调度实现大量操作的串、并行执行,并实时展现切换流程执行进度和状态,将灾备切换效率提升300%,减少了约60%的操作人员数量。
具体来说,基于戴尔容灾切换管理平台解决方案,IT人员可以通过容灾切换管理平台提供的可视化配置界面和批量导入窗口,完成容灾流程脚本定制,并按照预先定义好的流程自动调度执行客户机上的脚本,实现灾备执行一键切换。此外平台提供切换和配置操作的历史记录查询功能,便于监管和审计部门的审计跟踪,在自动执行切换操作的页面内,系统会将报错信息展示给IT技术人员,减少人为失误,提高切换成功率。
升级核心存储实现产能升级,I/O性能提升500%
在业务创新方面,东亚银行总行正在逐步聚焦人工智能、大数据等领域,力求通过加强新兴技术在银行业务中的应用,着力打造创新型金融科技平台,推进对公对私业务、零售业务、国际业务以及信贷业务的创造性发展,推动持续化创新。
在数据存储支撑力提升方面,东亚银行启动了新一代总行智慧银行数字化转型工程,以打造数字化、智慧型银行为核心,推动大数据、移动互联、人工智能等金融科技技术与银行业务应用的深度融合。
在此过程中,要围绕客户访问量过大、在高峰时段并发访问系统响应慢等具体问题,有序提升数据服务能力,为此引入了Dell PowerStore 1000T将存储系统性能提升500%,缩短了信用卡、消费贷、房贷和经营贷等业务的审批时间,此外东亚银行还引入PowerMax 2000将其部署在深圳异地容灾中心,与上海主中心PowerMax利用SRDF(Symmetrix Remote Data Facility)实现数据保护 ,为银行的UNIX、Linux、Windows 等系统提供完整的业务持续性保障能力,保障系统连续运行实现高效远程灾备,极大地提升了深圳容灾数据中心的业务服务能力。
Dell PowerMax采用双通道的英特尔傲腾固态盘,相比SAS SSD将I/O响应时间降低了50%,通过智能分层形成了NVMe SSD、英特尔傲腾固态盘和DRAM三级联动的高效数据通道,让PowerMax更大限度地提高了多控制器体系结构的性能,IOPS达到1500万、I/O带宽达到350GB/s,提供近纳秒级的数据延迟,保障金融数据处理的高效性。
Dell PowerStore存储存储控制系统配置了英特尔至强可扩展处理器,可以优化I/O工作负载,处理器具有出众的可靠性和卓越的计算效能,可以帮助存储控制器快速完成数据管理与传输任务。
此外,戴尔科技集团还提供了ProSupport Plus白金级专业技术支持服务,由SAM经理作为单一联络人,协调各部门技术力量,提供高效专业的服务,包括日常的健康检查和系统维护,定期的检修报告和合约续签报告, 将对东亚银行的IT支持服务拓宽到更全面的领域,提升到新的专业化水平。
东亚银行(中国)有限公司相关项目负责人表示:“基于业内专业的业务连续性及容灾咨询服务,戴尔科技集团咨询团队支持我们以智能运维的方式实现银行核心数据中心容灾自动化切换,大幅提升了银行业务的安全保障能力。使银行全面具有了保障资金和业务安全的自动化处理能力,总计65个切换步骤有49个步骤实现自动化,将灾备时间缩减75%,减少了约60%的操作人员数量,大幅提升了核心业务系统数字化灾备能力,在金融行业树立了一个安全保障的新标杆。”