首页 > 通信行业标准(YD) > YD/T 2916-2015 基于存储复制技术的数据灾备技术要求
YD/T 2916-2015

基本信息

标准号: YD/T 2916-2015

中文名称:基于存储复制技术的数据灾备技术要求

标准类别:通信行业标准(YD)

标准状态:现行

出版语种:简体中文

下载格式:.zip .pdf

相关标签: 基于 存储 数据 技术

标准分类号

关联标准

出版信息

相关单位信息

标准简介

YD/T 2916-2015.Technical requirements for disaster recovery based on storage replication.
1范围
YD/T 2916规定了基于存储复制数据实现灾备的技术要求,包括数据复制模式与方法、数据完整一致性、传输安全与可靠性、通信性能与效率、备份与恢复操控管理、服务级别等。
YD/T 2916适用于基于存储复制技术的数据灾备系统。
2术语和缩略语
2.1术语和定义
下列术语和定义适用于本文件。
2.1.1
灾难 Disaster
由于人为或自然的原因,造成信息系统严重故障或瘫瘓,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定时间的突发性事件,通常导致信息系统需要切换到灾备中心运行。
2.1.2
生产中心 Production Center
生产主系统所在的数据中心。
2.1.3
生产系统 Production System
正常情况下支持组织日常运作的信息系统,包括主数据、主数据处理系统应用和主网络。
2.1.4
灾备中心 Backup Center for Disaster Recovery
用于灾难发生后接替生产系统进行数据处理和支持关键业务功能运作的场所。
2.1.5
灾备系统 Backup System for Disaster Recovery
用于灾难恢复目的,由数据备份系统、备用数据处理系统和备用的网络系统组成的信息系统。
2.1.6
存储介质 Storage Media
非易失性存储介质如磁盘、固态硬盘等。

标准图片预览






标准内容

ICS35.220
中华人民共和国通信行业标准
YD/T2916-2015
基于存储复制技术的数据灾备技术要求Technical requirements fordisaster recoverybasedonstoragereplication
2015-07-14发布
2015-10-01实施
中华人民共和国工业和信息化部发布前言·
范围-
2术语和缩略语·
2.1术语和定义·
2.2缩略语·
数据复制
4.1灾备数据
灾备网络·
复制流程
复制技术模式
复制拓扑扩展·
复制协议
传输协议·
复制状态机··
完整一致性
安全可靠性·
复制性能
操控管理··
服务级别·..
9.1同步优先级
9.2灾备网络带宽
参考文献·
YD/T2916-2015
本标准是通信灾备系列标准之一,该系列标准预计发布如下:《集中式远程数据备份技术要求》《集中式远程数据备份测试要求》《共享灾备中心数据安全保护技术要求》《基于存储复制技术的数据灾备技术要求》《基于存储复制技术的数据灾备测试要求》《灾难备份中心选址要求》
《灾难备份专业服务能力要求》《信息系统灾难恢复能力要求》本标准按照GB/T1.1一2009给出的规则起草。YD/T2916-2015
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本标准由中国通信标准化协会提出并归口。本标准起草单位:北京邮电大学、北京安码科技有限公司、北京同有飞骥科技股份有限公司。本标准主要起草人:辛阳、朱洪亮、徐勤、孙斌、张恒、李正文、张毕涛、王一颖、李浩、
马立珂。
1范围
基于存储复制技术的数据灾备技术要求YD/T2916-2015
本标准规定了基于存储复制数据实现灾备的技术要求,包括数据复制模式与方法、数据完整一致性、传输安全与可靠性、通信性能与效率、备份与恢复操控管理、服务级别等。本标准适用于基于存储复制技术的数据灾备系统。2术语和缩略语
2.1术语和定义
下列术语和定义适用于本文件。2.1.1
灾难Disaster
由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定时间的突发性事件,通常导致信息系统需要切换到灾备中心运行。2.1.2
生产中心ProductionCenter
生产主系统所在的数据中心。
生产系统ProductionSystem
正常情况下支持组织日常运作的信息系统,包括主数据、主数据处理系统应用和主网络。2.1.4
灾备中心BackupCenterforDisasterRecovery用于灾难发生后接替生产系统进行数据处理和支持关键业务功能运作的场所。2.1.5
灾备系统BackupSystemforDisasterRecovery用于灾难恢复目的,由数据备份系统、备用数据处理系统和备用的网络系统组成的信息系统。2.1.6
存储介质StorageMedia
非易失性存储介质如磁盘、固态硬盘等。2.1.7
光纤通道FiberChannel,FC
一种主要用于存储网络利用专用设备进行数据高速传输网络的标准。2.1.8
小型计算机系统接口SmallComputerSystemInterface,ScSl一种主要用于主机和智能设备如存储之间进行通信的协议标准。1
YD/T2916-2015
互联网小型计算机系统接口InternetSmallComputerSystemInterface,isCS一种基于TCP/IP协议来交换SCSI命令的协议,用于建立和管理存储设备、主机和客户机等之间的相互连接,并创建存储区域网络。2.1.10
恢复时间目标RecoveryTimeObjective,RTO灾难发生后,信息系统或业务功能从停顿到必须恢复的时间要求。2.1.11
块数据BlockData
为主机提供的最小原子存取访问单位的数据。2.1.12
恢复点目标RecoveryPointObjective,RPO灾难发生后,系统和数据必须恢复到的时间点要求。2.1.13
快照Snapshot
在秒级时间窗口产生的数据卷、文件系统或目录的时间点复制。2.1.14
同步复制SynchronousReplication数据写入生产系统与将该数据复制到灾备系统同时进行,直至主机收到两者的写入完成确认。2.1.15
异步复制AsynchronousReplication数据写入到生产系统至主机收到写入完成确认,后经延时复制到灾备系统。2.1.16
级联快照AssociatedSnapshot
同一数据卷或文件系统/目录的多个快照成组,之间通过指针映射以满足源数据一次写入对应组内各成员快照仅复制或重定向一次。级联快照能提升多时间点复制的快照性能和降低空间占用要求。2.2缩略语
下列缩略语适用于本文件。
FC-SAN
IP-SAN
Dense Wavelength Division MultiplexingFibre Channel
Fibre Channel over Ethernet
Fibre Channel Protocol
Fibre Channel Storage Area NetworkData input and output
InternetProtocol
IP Storage Area Network
Internet Small Computer System Interface Internet密集波分复用
光纤通道
以太网光纤通道
光纤通道协议
光纤存储区域网络
数据输入输出
网络互连协议
IP存储区域网络
小型计算机系统接口
3概述
NetworkAttached Storage
Storage Area Network
Virtual Tape Library
网络附加存储
存储区域网络
虚拟磁带库
YD/T2916-2015
图1是常见的两地三中心灾备示意图,将数据从生产主系统复制到同城或异地的灾难备份中心,保持生产应用在线不间断,灾后能利用灾备系统的数据恢复并重续信息系统的运行,降低乃至避免人为或自然灾难带来的损失。
生产中心
应用软件
主机系统
虚报化网络
存储系统
图1两地三中心灾备示意
同城容灾中心
异地容灾中心
不论灾备中心按所有者归属为私有或共享的哪一类,生产系统的存储IO堆栈从下到上共计4个层次进行存储复制,不同的层次对应了不同的数据复制技术:存储系统:在生产中心和灾备中心的存储系统(控制器与存储介质)间,不占用生产应用的主机a
和网络资源,复制协议私有导致主、备存储系统往往来自同一厂家;b)虚拟化网络:在网络交换层实现存储虚拟化,不占用生产应用的主机和网络资源,数据复制跨越支持多厂家存储系统,系统复杂性和兼容要求高:c)主机系统:服务器操作系统及集群,或虚拟机管理系统(Hypervisor)的文件系统存储卷管理器间,数据复制对生产应用性能有一定影响;d)应用软件:生产主机上如数据库管理系统、邮件系统等提供,数据复制对生产应用性能有一定影响,事务处理原子性保障强。
4数据复制
4.1灾备数据
灾备数据分为相对静态的生产系统平台、生产应用软件和动态的应用数据,其中应用数据包括块级与文件级两类:
YD/T2916-2015
a)块级数据:系统盘、基本卷、动态卷、逻辑卷以及数据按应用关联的多卷成组:b)文件数据:结构化如数据库,半结构化如邮件,非结构化文件级数据。4.2灾备网络
基于存储复制的数据灾备,生产中心和备份中心之间是一种远程的连接方式。一般提供两种接入方式:a)互联网接入方式,数据直接依托现有的互联网进行传输,这种方式简单便捷且费用少,但数据传输速率慢,可靠性不高:
b)租用运营商专线,这种方式费用比较昂贵,但可以获得高速的数据传输率和较好的可靠性。4.3复制流程
复制流程按时间顺序划分为以下阶段a)连接:生产系统和灾备系统间建立通信逻辑连接:b)初始化复制:若生产系统先于灾备系统建成并已有数据,需将数据初始化复制到灾备系统:c)数据同步:通过同步、异步复制,灾备系统进入与生产系统的数据同步期,期间复制可能因主动人为或被动原因暂停,后再重续连接和同步复制d)反向复制:灾后数据恢复利用灾备网络从灾备中心数据反向复制到生产中心。4.4复制技术模式
4.4.1同步复制
复制达到同步(也称镜像)后,生产中心与灾备中心的数据始终一致,灾后数据接近零丢失:如图2所示。由于生产系统要求灾备中心成功复制的应答完成数据写入,导致对生产主机响应性能影响较大,适用于近距离如同城(采用DWDM支持<100km)的情形。②
有距离限制灾备
图2复制技术模式
4.4.2异步
1、生产应用写入
2、数据复制
3、灾备写入确认
4.生产写入确认
同步复制
如图3所示,数据复制独立于主机写入,灾备中心的数据滞后于生产中心:异步复制对生产应用响应性能影响较小,适用于长距离灾备。①
远距离
图3复制技术模式
4.4.3半同步
1、生产应用写入
2、生产写入确认
3.数据复制
4、灾备写入确认
异步复制
生产应用性能影响介于同步和异步之间,如图4所示,将数据写入分为两阶段:缓存和永久存储介质。生产主机写入缓存成功即完成,待刷新缓存时同步复制记录的变更数据至灾备系统。生产应用写入
2、生产写入确认
oo有距离限制
3、数据缓存刷新
4、数据复制
5、灾备写入确认
6、生产缓存剧新确认
图4复制技术模式
一半同步复制
4.4.4时间点复制
YD/T2916-2015
如图5所示,生产系统先利用快照将时间点数据/日志初始化复制到灾备系统后,再创建一个级联快照并维护以不断将两个时间点之间数据/日志增量异步复制到灾备系统,灾备系统待增量复制完成可以快照产生时间点数据复制
1。生产应用写入
2、生产快照与缓联
4.5复制拓扑扩展
远距离
图5复制技术模式
数据的灾备复制拓扑主要有以下三种方式:图
3、生产写入确认
4、数据增量复制
5、火备快照
6、灾备写入确认
时间点复制
a)A-B-..-A:当只有两个生产中心A-B-A时,数据双向复制互为灾备也称互容,超过两个中心如A-B-C-A,数据复制级联成环,如图6所示,避免单中心失败导致数据丢失。生产
图6复制拓扑
b)一对多:如图7所示,同一份生产数据复制到多个灾备中心,采用组播能降低网络带宽要求。灾备
图7复制拓扑
c)多对一:如图8所示,将多个生产系统数据集中复制到单一灾备系统中。生产
图8复制拓扑-
4.6复制协议
复制协议具有以下特点。
一多对一
a)数据优先级:支持设置数据优先级;当网络带宽有限时,复制协议需要保证重要数据的优先处理。b)主机系统无关性:复制过程针对生产系统平台、生产应用透明。5
YD/T2916-2015
c)协议设计确保复制过程不间断生产应用服务。4.7传输协议
三种主流存储传输协议特征、灾备网络与适用场景见表1。表1复制传输协议
光纤通道
以太网
链路协议
4.8复制状态机
存储协议bZxz.net
≤100km
负荷率
微秒级
毫秒级
毫秒级
流控处理运营成本
图9标示出在生产系统和灾备系统间进行数据复制期间的不同状态及迁移。重新同步
Rejoin
记分牌日志
logging
同步中syncing
暂停复制
暂停复制
suspend
镜像mior
图9远程复制状态机
5完整一致性
数据复制的完整一致性需要从以下三层设计予以保障:启动复制
已连接
connected
分离split
适用场景
同步!
半同步
时间点复制
时间点复制
a)生产系统应用层:事务处理系统如数据库等是否静默IO实现原子性,包含打开文件的文件系统源数据的完整性:
b)复制传输层:添加穴余校验保障灾备系统收到完整、正确的数据;c)生产与灾备系统存取层:端到端跨不同级缓存到永久存储介质的元余校验,如T10-PI技术。6安全可靠性
数据在复制过程中,应充分保证数据的安全可靠,满足下述特性。a)针对不稳定的通信网络(尤其广域网或互联网):1)采用生产系统和灾备系统间通信逻辑链路余,适用于管控信息和灾备数据复制,两端系统在IO堆栈上都支持多路径技术,当某活动路径失败时能自动切换到其它路径,物理路径恢复后自动重连:2)数据包传输前添加校验供接收端验证确保数据可靠性。b)针对不可靠的通信网络:
1)实施灾备网络连接带内访问控制,发现,连接认证:6
YD/2916-2015
2)生产数据和管控信息传输前加密,强度依数据安全要求级别设定(40/56/128/256位),降低通信泄露信息风险:
3)灾备数据复制管理系统的用户访问控制,用户分级授权与登录认证,c)生产系统和灾备系统集群,单节点或控制器失败业务自动无缝切换。d)灾备网络或灾备系统节点故障或掉电恢复后,生产系统能记录数据变更以断点重传增量数据。e)生产系统或灾备系统的数据复制或管控协议版本兼容性问题识别。7复制性能
灾备网络用手数据复制的带宽利用率也称有效负荷率,实际复制所传输的数据除了生产写入数据外包含复制块数据的放大,灾备网络不同协议的包头负荷以及穴余校验等,其计算公式如下:带宽利用率=生产系统实际写入永久存储的数据容量/实际复制传输数据包的总容量为提高复制性能,通常采用以下方法:a)支撑远程复制的网络带宽费用较高,为提高其利用率,根据块或文件为单位的生产数据特征适用性分别进行:
1)压缩:静态或动态进行传输前压缩,接收端解压后存放;压缩系密集计算应用而占用较多CPU资源;
2)去重:传输前计算数据指纹,若已存在于灾备系统中,只需传递对应的索引值而非实际数据,灾备系统根据索引值读取并复制该数据再存放:去重系轻度密集计算需占用一定CPU资源和较大内存空间。
b)生产系统与灾备系统用于复制通信的多条链路间负载均衡,如SCSI-3ALUA技术等优化系统整体性能。
c)针对非同步复制方法模式,如半同步、异步等,在生产系统端:1)进行复制数据流量和颗粒大小控制以降低对生产应用影响:2)以增量记录数据变更记录,支持断点重传和传输实际写入数据。d)远程复制会话支持网络配置和通信协议变更且已传输数据保持有效,初始化同步与灾难恢复两个阶段涉及大量数据传输,临时将生产、灾备两个系统放置在高速网络里进行能缩短该阶段10倍以上的时间。
e)灾备系统数据支持索引和读取以降低数据恢复粒度和数据反向复制的数据量与时间:具体性能措施选择需综合平衡生产与灾备系统和灾备网络整体的系统性能影响。8操控管理
操控管理应具有以下几个特点:a)集中化管理:单一入口对生产系统、灾备系统与灾备网络的发现、配置、报警、设备与链接状态更新。
b)管理通道:使用灾备网络传递控制、管理信息,包括两种形式:1)带内--与数据复制共用链路:2)带外一独立于数据复制使用专用链路。c)管理接口协议:与操作系统无关。7
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。