GB/T 28827.3-2012
基本信息
标准号:
GB/T 28827.3-2012
中文名称:信息技术服务 运行维护 第3部分:应急响应规范
标准类别:国家标准(GB)
标准状态:现行
出版语种:简体中文
下载格式:.rar .pdf
下载大小:1349KB
相关标签:
信息技术
服务
运行
维护
应急
响应
规范
标准分类号
关联标准
出版信息
相关单位信息
标准简介
GB/T 28827.3-2012 信息技术服务 运行维护 第3部分:应急响应规范
GB/T28827.3-2012
标准压缩包解压密码:www.bzxz.net
标准内容
ICS35.080
中华人民共和国国家标准
GB/T28827.3—2012
信息技术服务
运行维护
第3部分:应急响应规范
Information technology serviceOperation and maintenance-Part 3.Emergency response specification2012-11-05发布
中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会
2013-02-01实施
规范性引用文件
术语和定义
应急响应过程概述
应急准备
监测与预警
应急处置
总结改进
附录A(资料性附录)应急事件级别划分指南次
GB/T28827.3—2012
附录B(资料性附录)应急响应各阶段工作内容与日常工作、故障响应、重点时段保障等不同类型活动的对应关系·
参考文献
GB/T28827《信息技术服务
运行维护》分为6个部分:
第1部分:通用要求;
第2部分:交付规范;
第3部分:应急响应规范;
第4部分:数据中心服务规范:
一第5部分:桌面及外围设备服务规范:一第6部分:应用系统服务规范。本部分为GB/T28827的第3部分。本部分按照GB/T1.1—2009给出的规则起草GB/T28827.3—2012
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本部分由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。本部分起草单位:太极计算机股份有限公司、山东浪潮齐鲁软件产业股份有限公司、东软集团股份有限公司、中国电子技术标准化研究院、神州数码系统集成服务有限公司、北京信城通数码科技有限公司、成都勤智数码科技有限公司、武汉太阳花网络安全维护有限公司、成都信息化技术应用发展中心、万达信息股份有限公司。
本部分主要起草人:范凯、张帆、潘纯峰、马英恺、陈强、王志鹏、白璐、李娜、刘玲、王春涛、陈涛、杨凯榴、顾峻。
GB/T28827.3-—2012
随着各行业、各领域信息化工作的深人开展,越来越多的信息系统进人运行维护阶段。然而,提供运行维护服务的各类组织的能力水平参差不齐,需方缺乏评价或选择供方的方法、手段及规范。GB/T28827《信息技术服务运行维护》规定了提供信息技术运行维护服务的组织应具备的能力、服务交付形式和内容,以及运行维护服务中的应急响应过程和管理方法等。各部分之间的关系如图1所示。服务对象
信息技术服务
运行维护第4部分:
数据中心服务规范
服务过程
信息技术服务运行维护
第2部分:交付规范
服务能力
信息技术服务
运行维护第5部分:
桌面及外设备服务规范
信息技术服务
运行维护第6部分:
应用系绕服务规范
信息技术服务运行维护
第3部分:应急响应规范
信息技术服务运行维护第1部分:通用要求图1GB/T28827各部分之间的关系本部分提出了应急响应的基本过程,以及过程管理要求,旨在提升组织的应急响应能力,提前发现隐患,及时解决问题,降低应急事件可能带来的不良影响。本部分与突发事件应对所涉及的领域是有区别的。一般来说,前者主要涉及信息技术服务领域:而后者主要涉及自然灾害,事故灾难、公共卫生事件和社会安全事件等突发事件应对的业务领域。本部分不洗及信良系统的建设,俱在信息系统运行维护阶段,通过应急响应的实施,可以反馈系统使用效果,并根据业务发展不断进行系统适应性调整,用以指导信息系统完善和升级改造工作的开展。本部分的第4章提出了运行维护服务中应急响应的过程,将过程划分为4个主要阶段,并对各阶段工作内容进行了描述。
本部分的第5章规定了应急准备阶段的工作要求。本部分的第6章规定了监测与预警阶段的工作要求。本部分的第7章规定了应急处置阶段的工作要求。本部分的第8章规定了总结改进阶段的工作要求。本部分的附录A给出了应急事件级别划分要素和定级步骤。本部分的附录B给出了应急响应各阶段的工作内容与日常工作、故障响应、重点时段保障等不同类型活动的对应关系。
iKacaiaiKAca
1范围
信息技术服务运行维护
第3部分:应急响应规范
GB/T28827的本部分规定了应急响应过程的基本活动和任务。GB/T28827.3—2012
本部分适用于指导在经济建设、社会管理、公共服务以及生产经营等领域重要信息系统运行维护中实施和管理应急响应。
本部分也适用于组织为满足应急响应实施需要而开展的信息系统完善和升级改造工作。本部分不适用于电信基础设施和电信业务系统的运行维护。2规范性引用文件
下列文件对于本文件的应用是必不可少的,凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T28827.1-2012信息技术服务运行维护第1部分:通用要求3术语和定义
GB/T28827.1—2012中界定的以及下列术语和定义适用于本文件。3.1
重点时段保障importantperiodassurance提升服务级别以确保某一时间段内重要活动或重点业务的开展所采取的措施和活动。3.2
应急事件emergencyevent
导致或即将导致运行维护服务对象运行中断、运行质量降低,以及需要实施重点时段保障的事件。3.3
应急响应emergencyresponse
组织为预防、监控、处置和管理应急事件所采取的措施和活动。4应急响应过程概述
4.1应急响应过程的阶段划分
本部分将运行维护服务中应急响应过程划分为4个主要阶段:应急准备、监测与预警、应急处置和总结改进。如图2所示。
应急准备
测与预警
应急处置
图2运行维护服务应急响应过程
总结改进
GB/T28827.3—2012
4.2应急响应各阶段的工作内容
应急响应各阶段的工作内容如下:a)应急准备阶段的工作包括:组建应急响应组织,确定应急响应制度,系统性识别运行维护服务对象及运行维护活动中可能出现的风险,定义应急事件级别,制定预案,开展培训和演练;b)
监测与预警阶段的工作包括:进行日常监测,及时发现应急事件并有效预警,进行核实和评估,以规定的策略和程序启动预案,并保持对应急事件的跟踪:e)应急处置阶段的工作包括:采取必要的应急调度手段,基于预案开展故障排查与诊断,对故障进行有效、快速的处理与系统恢复,及时通报应急事件,提供持续性服务保障,进行结果评价,关闭事件:
总结改进阶段的工作包括:对应急事件发生原因、处理过程和结果进行总结分析,持续改进应d
急工作,完善信息系统。
应将信息系统所支撑业务的数据采集、使用和管理纳人应急响应过程中。在应急准备阶段,结合业务领域突发事件级别和运维活动中的应急事件级别,制定总体预案,开展培训和演练。在监测与预警阶段,从运行维护对象和数据两个角度开展监测预警。在应急处置阶段,根据业务数据变化情况采取相应措施。在总结改进阶段,也应该对业务数据采集、使用和管理体系进行完善。注:应急响应各阶段的工作内容与日常工作、故障响应、重点时段保障等不同类型活动的对应关系见附录B。5应急准备
5.1建立应急响应组织
运行维护服务的组织由相关利益方组成,包括服务需方、服务供方、分包方、供应商等。应在运行维护服务组织基础上建立应急响应组织,要求如下a)应急响应组织的人员应属于运行维护服务组织的人员,也可包括其他机构的专家和人员;应规定运行维护服务及应急响应所有相关利益方的角色及职责,并为关键角色提供备份人b)
选。应明确:
1》应急响应责任者:可由服务需方的信息化部门最高管理者担任,统筹协调应急响应工作:2》现场负责人:由应急响应责任者授权,负责应急事件监测与预警、应急处置等现场工作;3)分组负责人:可在组织内成立多个分项小组并设定负资人,承担应急响应中各专业性工作;
4)值班人员:组织内承担现场值守工作的人员;c)应就应急响应服务的范围、要求等与相关利益方达成一致,确定沟通流程和方式,并形成记录,d)
运行维护过程中涉及组织和人员的变更应与相关利益方达成一致,并形成记录;应建立对应急响应组织内人员的考核机制,明确考核指标及方法。考核至少每年进行一次,以e
确保组织能持续满足应急响应要求。5.2制定应急响应制度
组织应制定应急响应制度,明确应急响应的目标、原则、范围以及各项管理制度,并要求a)与相关利益方就应急响应制度达成一致;b)定期对应急响应制度进行评审;c)在组织战略、业务流程、客户要求等发生重大变化时对应急响应制度进行调整。2
iiKacaQiaiKAca
5.3风险评估与改进
5.3.1风险评估
GB/T28827.3-2012
组织应按照确定的方法和流程对重要信息系统实施风险评估,确保组织了解其在运行维护过程中的关键活动、所需资源、限制条件及信息系统面临的各种风险要素。组织应了解当风险演变为应急事件时所产生的影响和后果,以及信息素统服务中断所带来的损失。组织应授权组织内或组织外的服务供方进行风险识别,并将授权通知到所有相关利益方被授权的服务供方应结合具体的信息系统现状和要求,从技术和管理等方面确定风险要素。应对风险要素进行评估,形成风险评估报告,报告内容应包括:a)结论摘要;
b)背景及现状;
c)风险要素;
识别出的风险及风险分析;
建议的应对措施。
应在需方授权范围内对风险评估报告进行评审和沟通,并达成一致。5.3.2改进
对于识别出的各种风险,组织应该制定明确的控制策略,必要时应对信息系统进行升级改造。可供选择的风险控制策略包括:风险规避、风险转移、风险降低、风险接受。根据风险评估报告,组织应该形成改进方案并实施,以利于:a)降低风险转变为应急事件的可能性;b)缩短应急事件的持续时间;
c)限制应急事件的影响范围。
5.4划分应急事件级别
5.4.1参考要素
应急事件分级的主要参考要素为:信息系统的重要程度、信息系统服务时段、信息系统受损程度。a)重要程度
重要程度主要应考虑信息系统所支撑的业务的重要性,以及信息系统内信息资产的重要性和信息系统服务的重要性。
b)服务时段
服务时段主要应考虑应急事件发生时系统提供服务的状态。e)受损程度
受损程度主要应考虑应急事件发生时信息系统功能和性能等方面的影响程度。5.4.2级别划分
组织可按照5.4.1中的要素对可能发生的应急事件进行级别划分(级别划分方法见附录A)。组织应结合自身的业务要求,对应急事件级别对应的响应时间、处置完成时间等达成一致。组织应根据应急事件级别配置响应的保障措施,如人员、资金和设备等。5.5应急响应预案制定
5.5.1预案制定与评审
组织应根据应急事件级别制定应急响应预案。3
GB/T28827.3-—2012
应急响应预案可以分为总体预案和针对某个核心系统的专项预案。应急响应预案的格式应该能够为应急响应组织进行系统恢复操作提供快速明确的指导。应急响应预案应该明确、简洁,易于在紧急情况下执行,并使用检查列表。应急响应预案的内容应包括:
a)应急响应预案的编制目的、依据和适用范围:b)具体的组织体系结构及人员职责;c
应急响应的监测和预警机制;
应急响应预案的启动;
应急事件级别及对应的处置流程、方法,e)
应急响应的保障措施;
g)应急预案的附则。
服务需方应组织对应急响应预案进行评审,并与相关利益方达成一致。5.5.2预案发布
经过评审确认的应急响应预案,应由应急响应责任者负责发布。应急响应预案应进行版本控制。5.6培训与演练
5.6.1培训
组织应制定应急响应培训计划,并组织相关人员参与。应急响应预案应作为培训的主要内容。培训应使得组织及人员明确其在应急响应过程中的责任范围,接口关系,明确应急处置的操作规范和操作流程。
培训应至少每年举办一次。
5.6.2演练
为检验应急响应预案的有效性,同时使相关人员了解运行维护预案的目标和内容,熟悉应急响应的操作规程,组织应进行应急演练,应:a)预先制定演练计划、演练脚本;b)演练的整个过程应有详细的记录,并形成报告;c)演练不能影响业务的正常运行。为提升应急响应能力,组织可采用无脚本演练。必要时,组织可根据演练的效果,对应急响应预案进行完善6监测与预警
6.1日常监测与预警
6.1.1范围
组织应持续开展日常监测活动,实施有效预警,范围如下:a)组织应该对运行维护服务对象的运行情况进行监测与预警,以跟踪和判别以下对象的容量、可用性和连续性:
1)应用系统;
2)支撑应用系统运行的系统软件、工具软件;4
iiKacaQiaiKAca
3)网络及网络设备;
4)安全设备;
5)主机、存储、外设、终端等设备;6)电力、空调、消防等基础环境。GB/T28827.3—2012
组织应对信息系统所承载的业务数据进行监测,以跟踪和判别业务数据是否超出了预警b)
条件。
6.1.2手段与工具
组织应结合运行维护服务级别协议和应急响应预案,开展日常监测与预警活动,包括:a)设立服务台并保持运营:
b)建立知识库并保持更新:
c)确定监测项、监测时间间隔与阅值;d)确定活动中的人员、角色和职责。组织可以采用运行维护工具与人工相结合的方式开展日常监测与预警活动。6.1.3记录与报告
组织应建立监测、预警的记录和报告制度,并按照约定的形式和时间间隔上报现场负责人。发现应急事件时,值班人员应提交报告,报告内容应包括:a)应急事件发生及发现的时间、位置;b)现象描述;
c)影响的范围;
d)初步原因分析;
e)报告人。
报告应及时提交给现场负责人。报告方式包括电话、邮件、传真或书面文件等,并确认对方收到报告。
值班人员应采取必要措施,开展应急事件的先期处置,以提高应急响应效率,避免次生、衍生事件的发生。
应该对应急事件保持持续性跟踪。6.2核实与评估
6.2.1核实
现场负责人应对报告内容进行逐项核实。核实确认后的应急事件报告,应提交给应急响应责任者。应急事件报告应作为事件级别评估的输入。重点时段保障需求也应作为事件级别评估的输入。6.2.2事件级别评估
现场负责人应根据事件级别定义,初步确定应急事件所对应的事件级别。应将事件级别置于动态调整控制中。6.3应急响应预案启动
6.3.1预案启动
组织应建立,审议应急响应预案启动的策略和程序,以控制预案启动的授权和实施。5
GB/T28827.3—2012
组织应就应急响应预案启动可能造成的影响进行评估。相关利益方之间应就启动何种类型预案达成一致,包括当事件升级时,与之相对应的预案调整的方式。
可根据先期处置要求进行应急响应预案的自动启动,或由应急响应责任者或现场负责人启动预案。应记录应急响应预案启动的过程和结果。重点时段保障应启动的应急响应预案可参考同级别预案确定。6.3.2信息通报免费标准bzxz.net
现场负责人应向相关利益方通报应急响应预案启动信息,内容应包括:a)预案启动的原因;
b)事件级别;
事件对应的预案:
d)要求采取的技术应对措施或处置的目标;实现目标所应采取的保障措施,如人员、资金和设备等:e)
对应急处置过程及结果的报告要求,如报告程序、报告内容、报告频率等;信息通报的范围和接收者。
信息通报应选取适当的方式,如电话、邮件,传真、书面文件等。所有相关利益方应对收到的通报信息进行确认和反馈。6.3.3监测与预警状态的调整
通报信息应作为监测与预警状态调整的输人,调整内容包括监测范国、监测频率等。监测与预警状态的调整应通知各相关利益方。7应急处置
7.1应急调度
按照预案,开展统一的应急调度,包括人员、资金和设备等。应急调度中应:
a)获取现场信息;
b)组织必要人员进行勘察、分析:下达调度命令并保持跟踪:
保护可追查的相关线索。
7.2排查与诊断
7.2.1基本流程
故障排查与诊断的流程应包含以下内容:a)现场负责人调度处置人员进行现场故障排查:b)现场处置人员进行故障排查和诊断,必要时可寻求组织其他人员以现场或远程方式进行支持,在此过程中可借助各类排查诊断分析工具,如应用软件、电子分析工具、故障排查知识库等;现场处置人员应随时向现场负责人汇报故障排查情况、诊断信息、故障定位结果等;c
d)将排查与诊断的过程与结果信息进行整理与归档。6
iiKacaQiaiKAca
7.2.2问题沟通与确认
GB/T28827.3-—2012
处置过程中,现场负责人应及时与相关利益方进行沟通,沟通的内容主要包括系统故障点、造成故障的原因、排查诊断状况等。
现场负责人应组织相关利益方对问题进行确认。问题确认过程不应延误处理与恢复工作的开展。7.3处理与恢复
应基于应急响应预案、配置管理数据库、知识库等进行故障处理和系统恢复,处理与恢复的原则包括:
a)应在满足事件级别处置时间要求的前提下,尽快恢复服务;b)采用的方法、手段不应造成次生、衔生事件的发生。必要时可启用备品备件、灾备系统等。应该对过程及结果信息进行记录,并及时告知相关利益方。现场负责人应组织对处理与恢复的结果进行初步确认。7.4事件升级
7.4.1升级
组织应建立、审议应急事件升级的策略和程序,以控制应急事件升级的授权和实施。当实际处置时间超过事件级别处置时间要求时,应作为事件升级的参考要素。组织应该对事件升级可能造成的影响进行评估,并在相关利益方之间达成一致。升级内容应包含预案调整、人员调整、资金调整以及设备调整。事件升级的实施授权应由现场负责人启动。应该对事件升级的过程和结果信息进行整理与归档。7.4.2信息通报
现场负责人应向相关利益方通报事件升级信息,内容应包括:a)事件升级的原因;
b)事件升级后的级别;
c)事件升级后与之对应的预案;d)对升级事件处置过程及结果的报告要求,如报告程序、报告对象、报告内容、报告频率等;e)信息通报的范围和涉及的接受者。信息通报应选择适当的方式,如电话、邮件、传真、书面文件等形式。事件升级信息应作为处理与恢复的参考要素。7.5持续服务
完成处理与恢复后,应组织运行维护人员提供持续性服务。组织应对持续性服务的效果进行评价。持续服务的评价结果,应作为应急事件关闭的输人。7.6事件关闭
7.6.1申请
组织应建立、审议事件关闭的策略和程序,以控制事件关闭的授权和实施。7
GB/T28827.3-—2012
应该对应急事件处置的过程文档进行整理。事件关闭申请应由相关的分组负责人提出,并提交相关文档资料。事件关闭申请和文档资料,应作为事件关闭核实的参考要素。7.6.2核实
现场负责人接到事件关闭申请后,应逐项核实报告内容,以判别应急事件处置过程和结果信息是否属实。
7.6.3调查和取证
当应急事件涉及到责任认定、赔偿或诉讼时,应收集、保留和呈递证据。证据可能用于:a)内部问题分析;
b)用作合同违约或其他纠纷的法律取证:;c)与相关方谈判赔偿事宜。
7.6.4关闭通报
组织应建立、审议应急事件关闭通报制度。现场负责人应向相关利益方通报事件关团信息,内容应包:a)事件发生的原因、事件级别及影响范围;b)事件对应的预案;
事件的处置过程和方法;
事件的调整升级情况;
持续性服务情况;
事件处置评价;
事件关闭申请的处理意见;
h)关闭通报的范围和涉及接受者。应急事件发生的原因,处置过程和方法应记入知识库8总结改进
8.1应急工作总结
组织应定期对应急响应工作进行分析和回顾,总结经验教训,并采取适当的后续措施。对应急响应工作的分析和回顾应考患以下方面:a)应急响应工作的绩效;
b)应急准备工作的充分性和有针对性;应急事件发生原因、数量及频率;d)
应急事件处置的经验得失:
应急事件的趋势信息;
信息系统中潜在的类似隐患。
对应急响应工作的分析和回顾应形成总结报告,并将总结报告作为改进应急响应工作及信息系统的重要依据。
8.2应急工作审核
为保证应急响应的有效性和时效性,应急响应责任者应定期组织对应急响应工作的评审,以确保应8
iiKacaQiaiKAca
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。