一、 方案简介
华为HyperMetro特性又称双活特性(以下统称双活特性),双活特性中的两个数据中心互为备份,且都处于运行状态。当一个数据中心发生设备故障,甚至数据中心整体故障时,业务自动切换到另一个数据中心,解决了传统灾备业务无法自动切换的问题。提供给用户高级别的数据可靠性以及业务连续性的同时,提高存储系统的资源利用率。
华为提出以OceanStor为基础的存储双活架构,包括本地数据中心部署和跨数据中心部署的逻辑架构,为客户建设业务不间断运行的解决方案。
二、 方案定位
本地高可用解决方案在生产业务系统通过主机集群、冗余的光纤交换机、存储镜像等方式提高整个IT系统的可靠性。
随着IT系统建设集中化发展,用户数据集中化存储,数据总量越来越大,业务连续性要求越来越高。现有IT系统主要面临以下问题:
l 存储系统的可靠性不高,数据丢失风险越来越高。
l 存储系统故障需要较长时间恢复,业务中断时间长。
l 已有设备老化,扩容又无法保护现有投资。
提升生产系统的可用性成为必然趋势。华为顺势推出本地高可用解决方案,帮助用户解决生产系统的软硬件可靠性问题。本地高可用解决方案在生产业务系统通过主机集群、网络双交换和存储镜像等方式提高存储、数据、网络、服务器甚至应用的整个IT系统可用性。采用冗余部署方式后,单设备故障时,不影响业务连续访问。
三、 方案架构
华为存储双活架构如下图所示:
本方案在应用层和存储层都实现了高可用:
应用层通过主机集群或者应用程序集群实现高可用组网,当任一主机故障之后应用自动切换到其他主机。
存储层通过冗余的FC交换机、存储阵列的HyperMetro特性来实现存储层面的双活,达到高可用组网。其中任何一个存储阵列故障,另一台存储阵列仍能提供正常的I/O读写能力,主机业务不受影响。
华为存储阵列的HyperMetro特性实现了阵列级的A/A双活,来自两套存储阵列的两个LUN数据实时同步,且都能提供主机读写访问。
当任何一端存储阵列整体故障的情况下,主机将切换访问路径至正常的一端存储阵列继续业务访问。
当存储阵列间链路故障时,只有一端继续提供主机读写访问,具体由仲裁服务器确定由哪端的存储继续提供业务访问。
四、 方案特性
并行访问:真正A/A双活,两个存储阵列都支持业务读写,上层应用系统可以充分应用该业务能力实现业务负载分担部署,实现业务负载均衡。
免网关双活方案:组网简单,容易部署;减少一个故障点,提高了可靠性;避免了网关设备额外引入的约0.5ms的时延,性能更好。
FastWrite特性:优化存储传输协议,提前在目标端预留接收写请求的缓存空间,省掉“写分配”环节,将阵列之间数据同步时延缩短一半,提升了方案整体性能。
高可靠性设计:采用阵列集群、数据实时镜像、跨阵列坏块修复、仲裁、分布式锁等技术实现解决方案的高可靠性。
五、 方案特点
本地高可用解决方案是端到端全冗余方案,保证系统7×24小时持续运行;支持异构存储,保护已有投资,消除单点故障,防止设备老化影响业务系统运行。
l 高可靠性
数据中心端到端设备冗余,本地高可用解决方案通过对存储阵列中业务LUN创建卷镜像,使其同时拥有两份完全独立的数据副本。其中一份数据副本或者一台设备整体故障,不影响主机业务的运行,大大提高数据可靠性。
l 高兼容性
华为存储阵列可以广泛兼容其他厂商(如EMC、IBM、HDS、HP和SUN等)的常见存储设备,充分利用设备剩余资源,保护现有投资。
l 扩展灵活
结合存储阵列的远程复制等增值特性,可以平滑扩展到更高级别的容灾保护方案,如主备容灾、双活数据中心、两地三中心容灾等。