山东电力建设某工程公司两地三中心机房建设方案
山东电力建设某工程公司一直高度重视并不断加强信息系统建设。在2008年较早建成同城数据中心的基础上,为进一步提高重大灾难风险防范能力,公司于2015年底启动异地数据中心建设,目标是建成由A数据中心、B同城灾备中心、C异地灾备中心组成的“两地三中心”整体容灾体系,为打造具有核心竞争优势的现代化金融服务企业奠定了坚实的信息科技风险防范基础。
一、“两地三中心”布局规划
山东电力建设某工程公司作为扎根山东、服务全球的国际电站EPC持续领导者,从风险防范和企业社会责任角度出发,确定了“两地三中心”整体布局规划。针对“单数据中心”模式所存在的不足,进一步提出实现“双中心交替运行”的管理目标,即单个灾备应用系统(群)要具备切换到异地灾备中心持续运行、再回切到生产中心的能力,以此提高异地灾备系统的利用率和异地灾备运维人员的实战能力。双中心交替运行体现了“平战结合”的灾备建设和管理思路,通过生产和灾备系统的交替运行,既能做到切换和演练的常态化、实战化,提高整体灾难恢复能力,又能提升异地灾备建设投资回报和灾备中心的综合效益。
二、“两地三中心”架构设计
基于上述布局规划,山东电力建设某工程公司“两地三中心”整体容灾架构包括A数据中心、B同城灾备中心和国外C异地灾备中心,架构示意图如下图所示。
A数据中心配置完整的网络接入链路、应用处理平台和存储平台;B异地灾备中心配置主要的第三方接入链路、关键业务的应用处理平台和存储平台;B同城灾备中心只配置关键系统的存储平台。
在数据层,在三个中心之间采用三点存储数据复制架构满足异地容灾数据零丢失业务要求,在生产中心和异地灾备中心之间采用两点存储数据复制架构满足异地容灾数据丢失量小于15分钟的业务要求。
在网络层,生产中心和同城灾备中心通过两条DWDM裸光纤直接连接,而生产中心与异地灾备中心、同城灾备中心与异地灾备中心之间各通过一条2.5G的SDH链路连接,同时满足存储数据复制和网络数据传输要求。在IP网络上,生产中心和同城灾备中心二层互联,与异地灾备中心三层连接。在SAN网络上,采用物理线路环行布置的方式建立独立的三地复制SAN网,以支持存储数据三地双向复制。
在应用层,异地灾备中心不同应用系统按照灾备策略部署相应的主机和服务器;在同城灾备中心除共用的测试用服务器外,不部署应用主机和服务器。
三、主要技术难点
由于同城灾备中心与生产中心距离较近,数据能够实时同步复制,实现数据的零丢失(RPO=0),系统“双活”也更具实现可行性,因此相比“单数据中心”模式无论在灾备建设手段还是在灾备技术成熟度方面都具有一定优势。在目前的技术条件下,相距数万公里的两点之间尚无法做到数据的实时同步,因此异地应用级灾备建设较同城应用级灾备建设难度更大,主要的技术难点如下。
1.如何解决业务数据“0”丢失的要求
随着业务处理信息化程度不断提高,存放在系统内的业务数据成为业务能否快速恢复的关键,因此需要找出既能满足苛刻数据恢复要求,又能解决长距离数据复制不稳定问题的技术方案。
2.如何同时满足网络安全控制和快速切换的要求
灾备系统按其日常工作状态可分为主备系统和双活系统,前者仅在灾难发生时才启用接管业务,后者则常态化作为生产系统的组成部分对外服务,这就需要在网络上进行严格的安全控制,而在灾难情况下又能灵活快速地切换。
3.如何提高异地灾备资源利用率
为满足严格的RPO指标要求,在生产中心、同城灾备中心与异地灾备中心之间需要建设多条高带宽长途通讯线路。这些线路的日常运行费用在“两地三中心”总体运行成本中占有相当大的比例。如何在具体实现中减少长途线路数量、提高线路资源利用率,也是需要重点解决的问题。