首页 > 通信行业标准(YD) > YD/T 2850-2015 灾备系统性能测试方法
YD/T 2850-2015

基本信息

标准号: YD/T 2850-2015

中文名称:灾备系统性能测试方法

标准类别:通信行业标准(YD)

标准状态:现行

出版语种:简体中文

下载格式:.zip .pdf

下载大小:6097147

相关标签: 灾备 系统 性能 测试方法

标准分类号

关联标准

出版信息

相关单位信息

标准简介

YD/T 2850-2015.The performance test methods for disaster recovery ystem.
1范围
YD/T 2850规定了对灾备系统性能进行测试时的分析指标、测试方式、测试环境、测试流程以及测试内容,给出了灾备系统性能计算方法。
YD/T 2850适用于灾备系统的性能测试。
2术语、 定义和缩略语
2.1术语和定义
下列术语和定义适用于本文件。
2.1.1
恢复时间目标Recovery Time Objective
灾难发生后,业务系统从停顿到必须恢复的时间要求,主要指的是所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。
2.1.2
恢复点目标Recovery Point Objective
灾难发生后,系统和数据必须恢复到的时间点要求,主要指的是业务系统所能容忍的数据丢失量.
2.1.3
降级操作指标Degraded Operations Objective
系统经过灾难恢复后的运行性能降低预期。
2.1.4
网络恢复目标Network Recovery Objective
业务网点通过备份网络与数据中心重新恢复通信的时间指标。通常,网络要先于应用恢复才有意义,但应用恢复后才能提供业务访问。.
2.1.5
基准性能指标Performance Base
未施加特定的灾备技术时,原有生产系统所表现出的性能特征。
2.1.6
性能影响度Performance Impact Degree

标准图片预览






标准内容

ICS35.220
中华人民共和国通信行业标准
YD/T2850-2015
灾备系统性能测试方法
The performance test methodsfordisasterrecovery ystem2015-04-30发布
2015-07-01实施
中华人民共和国工业和信息化部发布前言
1范围
2术语、定义和缩略语
2.1术语和定义·
2.2缩略语
3概述·
4灾备系统性能分析指标·
5灾备系统性能测试方式
6灾备系统性能测试环境
7灾备系统性能测试流程及测试内容目
附录A(资料性附录)业务类型的服务级别分类次
附录B(资料性附录)SHARE78与《信息系统灾难恢复规范》的对应附录C(资料性附录)技术手段与RPO、RTO的对应关系·附录D(资料性附录)灾备系统性能计算方法·YD/T2850-2015
YD/T2850-2015
本标准是数据灾备系列标准之一,该系列标准的名称及结构如下:《第三方灾难备份数据交换技术要求》《灾备系统性能测试方法》(本标准)一《灾备数据一致性测试方法》《持续数据保护(CDP)灾备技术要求》本标准按照GB/T1.1-2009给出的规则起草。本标准由中国通信标准化协会提出并归口。本标准起草单位:工业和信息化部电信研究院、北京安码科技有限公司、北京邮电大学、华为技术有限公司。
本标准主要起草人:魏
薇、杜伟、黄
敏、杜晓峰、姚文斌、崔
TiiKAoNiKAca
1范围
灭备系统性能测试方法
YD/T2850-2015
本标准规定了对灾备系统性能进行测试时的分析指标、测试方式、测试环境、测试流程以及测试内容,给出了灾备系统性能计算方法。本标准适用于灾备系统的性能测试。2术语、定义和缩略语
2.1术语和定义
下列术语和定义适用于本文件。2.1.1
恢复时间目标RecoveryTimeObjective灾难发生后,业务系统从停顿到必须恢复的时间要求,主要指的是所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。2.1.2
恢复点目标RecoveryPointObjective灾难发生后,系统和数据必须恢复到的时间点要求,主要指的是业务系统所能容忍的数据丢失量。2.1.3
降级操作指标DegradedOperationsObjective系统经过灾难恢复后的运行性能降低预期。2.1.4
网络恢复目标NetworkRecoveryObjective业务网点通过备份网络与数据中心重新恢复通信的时间指标。通常,网络要先于应用恢复才有意义,但应用恢复后才能提供业务访问。2.1.5
基准性能指标PerformanceBase
未施加特定的灾备技术时,原有生产系统所表现出的性能特征。2.1.6
性能影响度PerformanceImpactDegree也称性能变化度,是指在施加特定的灾备技术时,生产系统所表现出的性能特征与基准性能指标之间的差异率。
成本风险平衡原则CostRiskBalancePrinciple灾难恢复资源的成本与风险可能造成的损失之间取得平衡的原则。根据灾难恢复的目标,按照成本风险平衡原则确定每项关键业务功能的灾难恢复策略,不同的业务功能可采用不同的灾难恢复策略,不的灾难恢复策略见附录D。
HiiKAoNiKAca
YD/T2850-2015
2.2缩略语
下列缩略语适用于本文件。
3概述
DegradedOperationsObjective
NetworkRecoveryObjective
RecoveryPoint Objective
Recovery Time Objective
Storage Area Network
降级操作指标
网络恢复目标
恢复点目标
恢复时间目标
存储区域网
灾备系统性能测试的主要目的是通过有效评估灾备系统自身性能以及施加灾备技术后对生产系统的影响程度,从而在满足灾备RTO和RPO等需求的前提下,选择合适的灾备技术,配置最佳的灾备系统参数,灾备系统建设中,不同的灾备技术路线对于原生产系统的性能影响有一定差异。灾备系统的性能指标是指灾备系统自身性能以及灾备系统对于生产系统的影响程度。灾备系统性能影响度的大小代表对现有生产系统的性能影响的大小,灾备系统技术路线的选择以灾备系统自身具有良好的性能,并且较少影响原有生产系统性能为目标。
a)灾难恢复的基本模式
灾难恢复的基本模式分为本地容错和异地容灾。Gartner根据业务类型的不同,提出了不同灾备等级对RTO和RPO的具体要求(参见附录A)。GB/T20988-2007《信息系统灾难恢复规范》借鉴了1992年SHARE78会议上Anaheim的M028报告,对灾难恢复能力进行了等级划分(参见附录B)。1)本地容错
本地故障、错误可以分为几种类型:网络设备岩机、服务器宕机、数据库宕机、存储设备宕机、线路中断、操作系统故障、应用系统故障、硬件设备故障、磁盘故障。本地设备和软件发生故障时,本地允余和备份的设备和软件可以帮助恢复故障。2)异地容灾
大灾难包括:自然灾难(地震、台风、洪水等)、突发事件(业务系统中断、通讯中断、计算机病毒、计算机网络犯罪、火灾影响、恐怖活动)等。大灾难使得本地的网络、服务器、存储设备岩机,技术支持人员不能及时到现场恢复,业务系统中断,从而造成重大损失和灾难。异地容灾是在本地发生大灾难时由异地设备提供业务容灾恢复。高端异地容灾由本地运行中心和异地备份中心组成,异地备份中心具有本地运行中心的相同业务系统,两个中心的数据是同步的。在无大灾难时,本地运行中心正常运行。在有大灾难时,关键业务的客户端的请求自动被送往异地备份中心的服务器,而异地备份中心的数据库提供已同步的数据响应客户端的请求,从而保证数据的完整性和一致性,保证业务7天×24小时不间断运行。中端异地容灾与高端异地容灾大部分相同,所不同的是对重要业务采用中端容灾硬件和软件,有数据丢失,业务短暂间断,投资成本较低。低端异地容灾可以对一般业务采用远端磁带库和磁盘进行定期备份,业务恢复时间长,数据丢失多,投资成本最低。b)灾备系统的备份方式
灾备系统备份方式的选择与应用的RPO密切相关,参见附录C:1)对于RPO要求低的应用(例如一天以上),可以采用磁带备份的方法进行数据备份,这种应用对于生产系统与灾备系统之间的网络连接无要求。2
TiiKAoNiKAca
2)对于RPO要求较高的应用(例如几个小时),可以采用异步数据同步的方式。3)对于RPO要求高的应用(例如几分钟),可以采用同步数据同步的方式。4灾备系统性能分析指标
衡量灾备系统的性能至少可从两方面指标进行分析:a)指标一:灾备系统自身的性能YD/T2850-2015
灾备系统由数据备份系统、备份处理系统、网络通信系统、灾备中心基础环境设施和灾难恢复计划等组成,如图1所示。针对灾备系统本身的性能测试包括对数据备份系统、备份处理系统、网络通信系统和灾备中心基础环境设施等的测试。对灾备系统本身的性能评价还需考虑成本风险平衡原则、灾备策略等因素。
流程、规范
技术方案
草备份腐线
图1灾备系统的组成
数据备份系统是灾难备份系统的最基本要素,一般由数据备份的硬件、软件和数据备份介质组成,如果是依靠电子传输的数据备份系统,还包括数据备份线路和相应的通信设备。如何将数据(包含系统、应用和业务数据)完整,实时地复制到灾备中心,是灾备系统建设时需要重点考惠的事项。备份处理系统指备用的计算机、外围设备和软件。备份处理系统所需要达到的处理能力和范围应基于恢复目标及成本效益等因素综合考虑。网络通信系统指最终用户用来访问灾备中心的网络,包含备用网络通信设备和备用数据通信线路。灾备中心的网络通讯系统要求能够提供正常业务运行的数据备份通道和灾难发生时系统切换后的业务数据流转,保证关键备份业务峰值性能要求。灾备中心基础环境设施指为数据备份系统、备份处理系统等提供基础承载环境的相关设施,通过灾备中心的选址、场地、环境和管理要求等措施,以保障灾备中心为用户提供服务。对该指标的测试可以从如下四个方面进行:1)数据备份系统:
·数据备份的范围:
·完成数据备份的时间;
·完成数据恢复的时间;
·灾备数据实际存储量:
·数据备份系统的带宽:
HiiKAoNi KAca
YD/T2850-2015
:数据备份系统的IOps(每秒IO次数)2)备份处理系统:
·数据处理能力;
·与主系统的兼容性要求。
3)网络通信系统:
·线路带宽:
·网络通信设备的容量。
4)灾备中心基础环境设施:
·灾备中心个数;
·灾备中心距离要求;
·场地和环境(如面积、温度、湿度、防火、电力和工作时间等)要求:·运行维护和管理要求。
b)指标二:灾备系统对生产系统的性能影响灾备系统对生产系统性能影响主要是衡量灾备系统在满足用户对RTO和RPO等要求前提下,进行数据备份和恢复时对生产系统的性能影响程度。原则上,性能影响度越小,代表灾备系统对于生产系统的性能影响越小,灾备系统性能越高。对该指标的测试可以从如下三个方面进一步衡量:1)对生产系统所提供业务性能的影响:如业务响应时间、业务吞吐量、并发用户数等2)对生产系统与灾备中心直接相连设备(如主机系统或数据库系统等)的性能影响:如主机系统数据库系统的CPU使用率、内存占用率、磁盘I/O吞吐量等:3)对生产系统(包含数据库、应用服务器等)的系统性能的影响:如系统并发连接数、新建连接数等。5灾备系统性能测试方式
最有效的灾备系统性能影响度测试是基于生产系统或类以于生产系统的测试环境所得出的结果,这种结果偏差最小,具有较强的指导意义,但此种测试环境往往难于构造。根据测试环境与实际生产系统的业务模型、事务模型、负载模型等方面的匹配程度,灾备系统性能的测试可采取三种方式:a)方式一\:实际业务程序测试此方式为直接使用生产系统的业务程序测试。一般而言,使用具备代表性的事务批处理型程序具备较好的参考性,这类结果能帮助使用方直接看到实际性能影响。例如使用电信系统中的晚间批处理流程进行性能影响度测试。
b)方式二:交易模拟测试
此方式为根据应用交易类型,选取大型的交易模拟和负载测试工具模拟业务情况,通过工具模拟联机事务处理、负载增加、并发用户、交易行为等。c)方式三:简单批量事务模拟测试此方式为在测试条件和成本有限情况下,使用简化的批量事务处理程序仿真在线事务处理和批处理。例如编写10万条交易数据库更新和录入脚本。无论选择何种测试方式,其各场景测试结果均需要与基准性能指标进行比较,从而进一步得出性能影响度评估数值。
HiiKANiKAca
6灾备系统性能测试环境
测试环境划分为基准测试环境、加载灾备技术的测试环境和灾备系统测试环境。a)测试环境一:基准测试环境
基准测试环境是指没有加载灾备技术的生产环境,如图2所示。生产系统
数据库服
交换机
磁盘阵列
Webl服务器/
应用服务器
生产程序或者
利川测试【几/程!
序仿真生产程序!
图2基准测试环境
b)测试环境二:加载灾备技术的测试环境灾备系统
YD/T2850-2015
灾备相关服务器
灾备相关磁盘阵列
加载了灾备技术的生产环境如图3所示。灾备实现的技术路线有多种方式,可能是主机复制容灾数据库复制容灾、持续复制器虚拟网关容灾、磁盘阵列级别容灾等,测试环境具体配置以及灾备系统性能评估指标的选择应该结合灾备的具体技术实现方案。生产系统
数据库服
交换机
磁盘阵列
Web服务器/
应川服务器
生产程疗或者
利用测试上几/程!
:序仿真牛产程序
主机卷复
制容灾/
数据库复
制容灾/
持续复制免费标准bzxz.net
器容灾/
磁盘阵列
图3加载灾备设备环境
灾备系统
灾备相关服务器
灾备相关磁碰盘阵列
iiiKAoiKAca
YD/T2850-2015
7灾备系统性能测试流程及测试内容灾备系统性能测试流程如图4所示,三种测试方式的测试流程基本类似。测试环境准备
系统基准性能指标获取
施加灾备技术后的系统性能指标获取灾备系统性能分析
图4灾备系统性能测试流程图
测试编号:1
测试项目:测试环境准备
测试目的:搭建测试环境
测试配置:测试环境1、测试环境2测试过程:
a)按照测试环境1连接测试设备,配置地址保持互通性:b)在测试主机上安装供测试的数据库系统,数据库需要加载一定数量的初始数据:c)在测试主机上加载生产系统或模拟生产系统的程序:1)如果采用方式一(实际业务程序测试),在测试主机上加载生产程序,通过实际用户操作典型业务流程,或者使用测试工具触发业务的典型流程:2)如果采用方式二(交易模拟测试),使用测试工具,编制交易模型脚本,通过模拟典型事务、并发用户数或并发负载、模拟思考时间等进行交易仿真:3)如果采用方式三(简单批量事务模拟测试),编写简单事务处理脚本向数据库批量插入和更新,进行交易简单仿真:
d)按照测试环境2和灾备技术方案连接灾备相关设备、连接灾备复制线路(也可以使用模拟的复制网络,并按照实际灾备环境设定带宽等参数),配置地址保持互通性,设置灾备相关参数;e)选择确定测试灾备系统性能的评估指标:1)灾备系统自身性能评估指标,如:数据备份系统的性能指标:数据备份的范围、完成数据备份的时间、完成数据恢复的时间、灾备数据实际存储量、数据备份系统的带宽、IOps指标等;·
备份处理系统的性能指标:CPU处理能力、数据缓存能力、IO吞吐能力、稳定性、与主系统的兼容性等:
网络通信系统的性能指标:线路带宽、网络通信设备容量等:TiiKAoNiKAca
YD/T2850-2015
灾备中心基础环境设施性能指标:灾备中心个数、灾备中心距离、场地和环境(如面积、温度、湿度、防火、电力和工作时间等)、运行维护和管理要求等。2)灾备系统对生产系统的性能影响度评估指标,如:生产系统的业务性能影响指标:业务响应时间、并发用户数、业务吞吐量;●生产系统与灾备直连设备性能影响指标:CPU使用率、内存占用率、磁盘I/O吞吐量;·生产系统的系统性能影响指标:系统并发连接数、新建连接数等预期结果:
a)测试环境连通;
b)生产程序和数据库正常运行:c)灾备相关功能正常运行:
d)测试相关工具正常工作:
e)明确了评估指标
判定原则:预期结果中各项内容均完成,则该测试项通过测试编号:2
测试项目:系统基准性能指标获取测试目的:测试获得生产系统没有使用灾备技术的性能指标、并且明确灾备系统自身性能指标测试配置:测试环境1
测试过程:
a)在测试环境1中,运行生产程序或者利用测试工具/程序仿真的生产程序。b)获取评估灾备系统性能影响度各指标的测试值,例如:1)生产系统业务性能影响指标:业务响应时间、并发用户数、业务吞吐量:2)灾备直连设备性能影响指标:CPU使用率、内存占用率、磁盘I/O吞吐量:3)生产系统网络性能影响指标:系统并发连接数、新建连接数等。c)多次运行程序,记录每一组测试数据,选择最准确的测试结果。d)确定灾备系统自身基准性能指标:对于灾备系统本身的性能来说,由于不同企业对基准值的要求可能不同,需根据企业实际情况、需求等确定灾备系统自身的基准性能指标预期结果:
a)程序正常执行,测试获得灾备系统性能影响度各指标的基准性能值b)根据企业实际情况、需求等确定了灾备系统自身基准性能指标判定原则:测试获得灾备系统性能影响度各指标的基准性能值,确定了灾备系统自身基准性能指标7
YD/T2850-2015
测试编号:3
测试项目:数据备份系统的性能指标获取测试目的:测试获得数据备份系统的性能指标测试配置:测试环境2
测试过程:
a)在测试环境2中,利用测试工具/程序直接对灾备系统的数据备份系统进行测试:1)获取数据备份的范围;
获取完成数据备份/数据恢复的时间:3)获取灾备数据实际存储量:
4)获取数据备份系统的带宽指标;5)获取数据备份系统的IOps指标。b)多次运行程序,全量备份、全量恢复、增量备份和增量恢复操作至少各执行一次:记录每一组测试数据,选择最准确的测试结果预期结果:程序正常执行,测试获得各指标的测试值判定原则:测试获得各指标的测试值测试编号:4
测试项目:备份处理系统的性能指标获取测试目的:测试获得备份处理系统的性能指标测试配置:测试环境2
测试过程:
a)在测试环境2中,利用测试工具/程序直接对灾备系统的备份处理系统进行测试:1)获取系统的CPU处理能力、数据缓存能力、I/O吞吐能力、稳定性等指标:2)获取与主系统的兼容性指标。b)多次运行程序,全量备份、全量恢复、增量备份和增量恢复操作至少各执行一次:记录每一组测试数据,选择最准确的测试结果预期结果:程序正常执行,测试获得各指标的测试值判定原则:测试获得各指标的测试值8
测试编号:5
测试项目:网络通信系统的性能指标获取测试目的:测试获得网络通信系统的性能指标测试配置:测试环境3
测试过程:
a)在测试环境3中,利用测试工具/程序直接对灾备系统的网络通信系统进行测试:1)获取系统的网络带宽指标:
2)获取网络通信设备的容量指标。YD/T2850-2015
b)多次运行程序,全量备份、全量恢复、增量备份和增量恢复操作至少各执行一次:记录每一组测试数据,选择最准确的测试结果预期结果:程序正常执行,测试获得各指标的测试值判定原则:测试获得各指标的测试值测试编号:6
测试项目:灾备中心基础环境设施的性能指标获取测试目的:测试获得灾备中心基础环境设施的性能指标测试配置:测试环境3
测试过程:
在测试环境3中,利用测试工具直接对灾备中心基础环境设施进行测试:获取灾备中心个数指标:
获取灾备中心距离指标:
获取场地和环境(如面积、温度、湿度、防火、电力和工作时间等)指标:获取运行维护和管理指标。
多次测试,全量备份、全量恢复、增量备份和增量恢复操作至少各执行一次:记录每一组测试数据,选择最准确的测试结果
预期结果:测试获得各指标的测试值判定原则:测试获得各指标的测试值-
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。