首页 > 通信行业标准(YD) > YD/T 2727-2014 互联网数据中心运维管理技术要求
YD/T 2727-2014

基本信息

标准号: YD/T 2727-2014

中文名称:互联网数据中心运维管理技术要求

标准类别:通信行业标准(YD)

标准状态:现行

出版语种:简体中文

下载格式:.zip .pdf

下载大小:4809899

相关标签: 互联网 数据中心 运维 管理 技术

标准分类号

关联标准

出版信息

相关单位信息

标准简介

YD/T 2727-2014.Technical requirements for operations and maintenance management of internet data center.
1范围
YD/T 2727规定了互联网数据中心(IDC)运维管理的主要功能要求,包括门户管理、服务管理、资源管理及维护、监控功能、统计分析及日志管理等方面的技术要求。
YD/T 2727适用于互联网数据中心(IDC)。
2术语和定义
下列术语和定义适用于本文件。
2.1
互联网数据中心 IDC
拥有宽带互联网出口,并以外包出租的方式为用户的服务器等或其他网络的相关设备提供放置、代理维护、系统配置及管理服务,以及提供数据库系统或服务器等设备的出租及其存储空间的出租、通信线路和出口带宽的代理租用和其它应用服务的电子信息系统机房。
3缩略语
下列缩略语适用于本文件。
IDC        互联网数据中心        Internet Data Center
HA         高可用性                  High Availability
QoS       服务质量                  Quality of Service
4运维管理系统功能要求
4.1概述
IDC运维管理系统功能包括门户、用户管理、监控管理、服务管理、资源管理等功能。管理用户通过门户对IDC中的资源进行配置和管理,运维管理系统中的各功能模块相互配合实现了资源的自动化监控与部署,使得资源的使用效率最大化。

标准图片预览






标准内容

ICS33.040.40
中华人民共和国通信行业标准
YD/T2727-2014
互联网数据中心运维管理技术要求Technical requirements for operations and maintenancemanagementof internetdatacenter2014-10-14发布
2014-10-14实施
中华人民共和国工业和信息化部发布前
范围·
术语和定义
缩略语·
运维管理系统功能要求·
概述·
运维管理门户。
用户管理·
服务管理
资源管理及维护
运维监控·wwW.bzxz.Net
统计分析
日志管理
安全功能要求
其他要求-
YD/T2727-2014
YD/T2727-2014
本标准是数据中心的系列标准文件之一,该系列标准文件的预计结构及名称如下:1)YD/T2542电信互联网数据中心(IDC)总体技术要求2)YD/T2441互联网数据中心技术及分级分类标准3)YD/T2442互联网数据中心资源占用、能效及排放技术要求和评测方法4)YD/T2543电信互联网数据中心(IDC)的能耗测评方法5)互联网数据中心(IDC)运维管理技术要求6)互联网数据中心(IDC)网络设备测试方法7)互联网数据中心(IDC)网络设备技术要求8)集装箱式数据中心(IDC)总体技术要求9)基于云计算的互联网数据中心网络互联技术要求10)基于云计算的互联网数据中心安全指南11)互联网数据中心(IDC)虚拟资源管理技术架构本标准按照GB/T1.1一2009给出的规则起草。本标准由中国通信标准化协会提出并归口。本标准起草单位:华为技术有限公司、工业和信息化部电信研究院、中国联合网络通信集团有限公司、上海未来宽带技术及应用工程研究中心有限公司、中国移动通信集团公司。本标准主要起草人:赵植、惠建恒、高巍、陈娜。Ⅱ
1范围
互联网数据中心运维管理技术要求YD/T2727-2014
本标准规定了互联网数据中心(IDC)运维管理的主要功能要求,包括门户管理、服务管理、资源管理及维护、监控功能、统计分析及日志管理等方面的技术要求。本标准适用于互联网数据中心(IDC)。2术语和定义
下列术语和定义适用于本文件。2.1
互联网数据中心IDC
拥有宽带互联网出口,并以外包出租的方式为用户的服务器等或其他网络的相关设备提供放置、代理维护、系统配置及管理服务,以及提供数据库系统或服务器等设备的出租及其存储空间的出租、通信线路和出口带宽的代理租用和其它应用服务的电子信息系统机房。3缩略语
下列缩略语适用于本文件。
互联网数据中心
高可用性
服务质量
运维管理系统功能要求
4.1概述
Internet Data Center
High Availability
Quality of Service
IDC运维管理系统功能包括门户、用户管理、监控管理、服务管理、资源管理等功能。管理用户通过门户对IDC中的资源进行配置和管理,运维管理系统中的各功能模块相互配合实现了资源的自动化监控与部署,使得资源的使用效率最大化。4.2运维管理门户
运维管理门户为运维管理提供了统一的系统管理平台,管理人员可以通过统一门户完成用户信息的管理、资源的配置管理、服务实例的管理以及报表管理等功能,为各管理功能提供了统一的管理平台。4.3用户管理
用户管理是对IDC中用户资源的统一访问控制。提供基于用户的操作功能,用户组管理,角色管理与权限管理功能。
4.3.1用户
4.3.1.1用户管理内容
YD/T2727-2014
对IDC中的用户进行管理,提供用户的注册、注销、用户信息修改、密码修改、密码重置、用户状态设置、用户信息查询等操作。其用户范围主要是使用系统的管理维护人员。4.3.1.2用户注册
运维管理平台统一门户支持进行用户信息的批量导入、注册。4.3.1.3用户注销
运维管理平台统一门户支持进行用户信息的注销、批量注销。用户注销时,系统应确认该用户的用户信息与业务订购情况,如不符合注销要求,系统应该提示用户下一步如何操作才能进行注销。用户注销后,系统将退订该用户的所有业务、释放相关资源,并且通知用户注销结果。4.3.1.4用户信息修改
用户可修改保存在运维管理平台的用户信息。用户登录门户后,可对用户信息进行修改。关键信息(如用户名等)可设置为不充许用户修改。4.3.1.5密码修改
用户登录门户后,可对其登录密码进行修改。用户需输入原密码、新密码、确认新密码,提交系统验证成功后,系统提示用户操作结果。4.3.1.6密码重置
支持用户重置密码,提交重置申请后,系统自动生成重置密码。4.3.1.7设置用户状态
系统管理员可对用户的状态进行设置。可将用户状态设为挂起,禁止用户在平台上进行业务申请等操作,并暂停其账户下的所有资源使用。用户挂起后也可将其状态恢复为正常。4.3.1.8用户信息查询
用户和系统管理员均可查询用户信息。用户可通过门户查看自已的相关信息,系统管理员可通过管理门户查看所有用户的信息。
4.3.2用户组管理
用户组管理是指对用户按照级别进行分层次维护和管理的功能。主要功能包括:一支持按不同的用户属性分组,不同用户组的用户拥有不同的操作权限;一支持创建、修改、查询和删除用户组:一支持增加、修改、删除组内用户;—支持用户组的查询和统计。
4.3.3角色管理
角色管理是指权限的集合分类。用户可以将权限添加到角色中,用于方便权限的分配。主要功能包括:
一支持角色创建、修改、查询和删除:一支持增加、修改、删除权限
一支持为用户赋予、取消角色:一支持角色浏览。
4.3.4权限管理
权限管理是指对运维管理平台中的功能进行分层、统一访问控制。主要功能包括:支持权限浏览:
一支持权限创建、修改、查询和删除:支持权限分级:
支持权限审计。
4.4服务管理
4.4.1概述
YD/T2727-2014
服务是IDC对外提供给用户的资源和资源集合的模板,用户根据自已的需求配置服务模板来进行服务的订购,这些订购的服务最终生成真实的资源及服务实例。IDC中的各种类型的资源都是以服务的形式提供给用户供其订购使用的。服务管理包括服务目录管理与服务实例管理。4.4.2服务目录管理
4.4.2.1服务目录管理的内容
服务目录管理是指根据目录类别对资源服务进行分级管理和显示,主要包括服务目录的创建和发布、服务变更、激活、挂起,撤销等功能。4.4.2.2创建
运维管理人员对IDC提供的计算、网络、存储资源进行抽象和组合生成对外提供的服务,并以目录形式对外呈现。主要功能包括:
一支持服务类别、层次及权限的定义:一支持通过服务名称、服务编码与服务版本能够唯一标示一个服务内容:一支持向服务目录的自动注册:一支持自动监测和判断创建服务所需资源是否合适:一支持按用户的权限级别对服务级别的服务自录的展示。4.4.2.3发布
服务创建后由审核人员审核,审核通过后系统将服务目录发布,并将服务状态修改为已发布。4.4.2.4变更
服务在发布后管理人员可以对服务目录信息进行修改,包括服务中提供的资源规格信息,服务类别,层次及权限等。在进行服务变更时系统需要自动检查是否存在用户正在申请被修改的服务模板,如果有用户正在申请,系统将进行告警提示。服务修改后自动更新服务目录中的相关信息。4.4.2.5查询
管理人员可对服务类别进行查询。主要功能包括:一支持通过检索语法进行关键字查询一支持对关键字的精确查询和模糊查询。4.4.2.6挂起
管理人员可以根据运维需要针对某些服务执行挂起操作,这样用户就无法订购该项服务。在执行挂起操作的时候系统需要检查是否存在用户正在申请该项服务,如果有用户正在申请,系统将进行告警提示。服务挂起后将自动更新服务目录中的相关信息。4.4.2.7激活
YD/T2727-2014
管理人员可以针对被挂起的服务执行激活操作,这样该项服务就可以被用户订购。4.4.2.8撤销
管理人员可以针对某些不再对外提供的服务执行撤销操作,这样该服务就会被删除并自动更新服务目录中的相关信息。在执行撤销操作时系统需要检查该项服务是否已经被订购或有用户正在申请该项服务,那么系统将进行告警提示。4.4.3服务实例管理
4.4.3.1服务实例管理的内容
用户通过服务目录订购服务,订购的服务生成服务实例,服务实例是服务的具体化。服务实例管理定义了服务实例预生成、创建、变更、查询、挂起、激活、终止等处理流程。4.4.3.2预生成
服务实例申请在审批通过后,按照服务目录的规范预生成相应的服务实例,并下发资源部署指令。主要功能包括:
一支持按照服务目录定义的服务属性预生成规范的服务实例;一支持对每个服务实例进行属性描述和配置,服务实例的属性首先应包括对应的服务目录的全部属性:
一支持在服务实例预生成后将其状态自动标识为预生成状态,并根据服务实例的属性生成资源部署指令。
4.4.3.3正式创建
服务实例管理模块收到下层的资源管理模块反馈的资源部署就绪指令后正式创建相应的服务实例。主要功能包括:
一一支持接收、解析资源管理模块反馈的资源部署就绪指令;一支持在收到资源部署就绪指令后将服务实例的状态由“预生成”自动修改为“正式创建”;一支持服务实例在正式创建后开始执行服务目录所指定的服务策略。4.4.3.4变更
用户可以修改服务实例的各个属性。至少支持通过两种途径进行服务实例的修改,一是由服务设计者修改对应的服务目录,二是根据服务管理员或用户对服务内容的变更修改服务实例的属性。4.4.3.5查询
根据用户或管理门户的查询请求,提供用户相关的服务实例列表,以及制定服务实例的基本信息、状态和资源分配信息。
4.4.3.6挂起
由服务管理员或用户暂停服务,并将服务实例挂起。挂起状态时,用户不能使用相关资源、已使用的资源暂不释放、各类内容信息暂不可被修改、服务实例实际运行时长的数值暂不变化、服务实例暂不需进行计费操作。
4.4.3.7激活
由服务管理员或用户将挂起的服务执行激活操作,将服务实例激活。服务实例从挂起状态变为激活状态后用户能够继续使用相关资源。4.4.3.8终止
YD/T2727-2014
当用户服务到期、用户主动撤销或基于管理因素等需求要求终止服务时,可实现服务实例终止,同时服务实例相关资源会自动释放。4.5资源管理及维护
4.5.1概述
IDC中包括物理资源和虚拟资源,通过对资源的合理建模屏蔽底层硬件细节整合系统中所有可用资源,合理有效的调度及自动化运维管理这些资源,实现对资源的生命周期管理和资源信息的综合管理。4.5.2调度管理
管理员通过采用不同的调度策略,实现多种调度功能。系统根据已配置的调度策略,自动进行资源调度。提供调度策略的创建、删除、修改、查看、激活、去激活等功能。调度策略主要功能包括:一定时周期调度:服务器上下电、虚拟机启动关闭:一负载均衡:系统自动将虚拟机分散到空闲服务器上,确保服务器的负载均衡和用户体验;一动态节能:系统自动将虚拟机集中到部分服务器上,对空闲服务器下电,节能环保:一虚拟机自动休眠:当用户一段时间内没有使用虚拟机时,系统自动将其休眠:当用户重新登录时,系统自动唤醒虚拟机。
除了考患调度功能外,调度算法需要考患系统整体性能。例如:避免遇短暂尖峰即刻响应造成频繁无谓调度。
4.5.3资源管理与操作
资源管理包括对物理机、虚拟机、存储类资源、网络资源、镜像、软件资源的操作维护管理。主要功能包括:
—一支持资源的批量操作:
一支持对物理机进行:上电、下电、重启、安全下电、安全重启,查看CPU、内存、网络流量、磁盘等资源使用率:
一一支持对虚拟机进行:创建、删除、配置、调整虚拟机规格、停止/恢复、休眠/唤醒、热迁移、HA、快照,查看虚拟机状态、CPU、内存、网络流量、磁盘等资源使用率;一支持对存储类资源进行:挂载虚拟磁盘,卸载虚拟磁盘,查看存储资源使用率:一支持对网络资源进行:配置网络VLAN等资源、查看网络流量;一支持对镜像进行:制作、注册、注销、删除、查看:一一支持对软件资源进行:软件自动化部署、升级、打补丁,查看软件版本、License授权等。4.5.4资源池的管理
资源池资源包括计算、存储、网络的物理资源池和虚拟资源池,业务IP资源。资源池管理包括对资源的配置、调整、查看。主要功能包括:一支持查看资源详细的静态信息和动态信息。静态信息指资源的固定属性,例如IP。动态信息指系统运行过程中会变化的资源,例如CPU使用率。资源池静态信息包括但不限于:类型、名称等。资源池动态信息包括但不限于:计算存储网络的资源总量、已使用量、剩余资源量。支持资源历史查询:一一支持根据虚拟机D等查询相应资源信息:一一支持以多种方式显示资源使用和资源统计,包括表格,图形等:—支持资源拓扑:
YD/T2727-2014
支持自定义资源池管理,例如,按照部门或业务类型管理资源池;在一定范围内,按照策略自动调配资源,确保虚拟机QoS一当资源池资源紧张时,支持预警。当资源不可用时,支持界面显示并告警:一支持资源简单扩容和减容,扩容减容单元包括计算资源和存储资源,以及集群等:支持资源回收:
一支持资源批量管理,包括资源的部署、资源分配。4.5.5资源模板管理
资源模板用于帮助管理员对资源进行定义,支持对模板进行增加、删除、修改、查看操作。资源模板主要是虚拟机模板。
资源模板内容包括:模板名、镜像、CPU、内存、系统磁盘、网卡数、CPU和内存的最小预留值和最大值。
使用资源模板,可以用来创建虚拟机。4.6运维监控
4.6.1资源监控
资源监控用于管理员对资源池系统中的各类资源、设备进行监控,提供对各类资源、设备的性能监控、故障报警等功能。
一可监控资源池中PC服务器的运行状况和健康状况,并可对异常状况进行告警;-可监控资源池中虚拟机的CPU、内存、存储、网络实际使用情况,并可对异常状况进行报警;可监控资源池中存储设备的使用情况:一可监控资源池中网络设备的流量信息、故障信息、告警信息,并可对异常状况进行告警:可以展示资源列表:
一可以设置监控数据的保存时长,超过保存时长的数据被自动清理:一资源池系统管理员具有查看整个资源池中的资源监控信息的权限,普通管理员具有部分权限。4.6.2告警管理
告警管理主要捕获运维平台各类设备的告警,进行故障诊断及定位分析。主要功能包括:告警参数设置:支持对告警类型、告警级别和发生时间、告警确认、告警确认时间等参数的管理,并支持告警参数删除和修改等操作:告警监控:需具备实时监控系统的负荷和故障情况的能力,保证系统的稳定运行:一告警等级:发往网管的告警级别可以设置:一告警过滤:根据关注的角度不同来设定不同的过滤条件,过滤出需要发送的告警数据,如告警代码、状态等:
告警通知方式:告警可以支持E-Mail、短信等多种通知方法,管理人员可对通知条件和告警的内容进行灵活定制:
告警信息处理与故障追踪:当产生告警的条件已经不存在,可以通过管理人员确认告警已经消除,或系统通过自动方式清除相关告警。4.7统计分析
统计分析功能提供资源池各类资源及运维系统各类信息的数据搜集、存储以及展示等功能,提供各种统计报表和分析报告。
统计报表功能应提供以下功能:YD/T2727-2014
一统计系统中所包含的所有物理机资源、虚拟机资源、存储资源、网络资源等资源信息:一一统计系统中每类资源的使用情况,如虚拟机系统每个分区的物理资源占用状况,块存储、对象存储、IP地址等网络资源的资源总量及占用状况:一统计系统中每个资源的历史使用情况,如:某个虚拟机什么时候被哪个用户以什么原因启动或关闭:
一统计系统中每个工单使用资源的情况,统计系统中某个用户的所有工单使用资源的情况。展现页面与格式要求:
一统计项选择:用户可选择所需的统计项进行查看:一一条件过滤:用户可设置查询条件对统计信息进行过滤,并且支持对多个查询条件使用“与”、“或”、“非”等逻辑关系组合过滤;一排序:用户可对每个统计信息项进行正序或倒序排序显示:—分页浏览:用户可设置每页显示行数,并可进行首末页与指定页数跳转;一权限感知:根据登录用户的角色和权限进行展现,对用户没有权限查看的信息不进行展现:一图形化展现:以图形化形式对数据进行展现;导出:可将统计报表输出为其他格式,包括:XML;
HTML:
电子表格:
图片(用于图形化展现输出):支持JPEG,GIF,PNG中至少一种格式。4.8日志管理
运维管理平台系统运行过程需要记录各类日志数据,运维管理平台需要支持对管理员设定日志的收集和存储功能,主要功能包括:一日志数据管理:运维管理平台系统需要提供日志的查询、删除、过滤、归档等功能,系统可记录的日志数据包括业务日志、系统日志、操作日志、安全日志:一日志数据备份:系统应支持日志手工备份或定期自动备份、日志容量达到门限自动启动备份或产生相应告警提醒操作人员进行手动备份;一日志容量告警:系统应支持日志记录占用空间达到设定的日志容量门限时上报告警功能一日志文件:日志文件应尽可能采用标准化的格式进行记录,以支持第三方审计系统的要求:一日志查询:支持系统管理员能对系统日志中的记录进行浏览与查询:一一日志保存:系统日志保存需要支持可配置有效性记录时间。4.9安全功能要求
4.9.1系统安全
运维管理平台应该通过操作员权限控制、操作日志记录等功能来保证系统及应用的安全性,主要功能包括:
YD/T2727-2014
一操作用户管理:运维管理平台应支持操作用户增加、删除和查询等基础管理功能:一角色/权限管理:运维管理平台可通过配置界面,直观地配置每个用户的角色/权限:一账户密码管理:运维管理平台应支持账户密码设置管理的功能:一操作用户访问安全保护:运维管理平台应支持用户安全访问:对用户权限进行控制:
一用户操作超时,系统注销用户信息或锁定用户操作界面:一对非法用户在进行非法登录,需要记录非法访问记录,长期进行攻击时,需要进行账户锁定或客户端锁定:
支持对用户操作进行日志记录:公众服务云运营管理平台需要记录每个用户的操作日志,需要的信息至少包括操作时间、用户登录IP、操作用户名和具体的操作信息等。4.9.2业务安全
运维管理平台应实现对所有接入自身的资源池系统进行身份接入认证和权限控制,包括:一实现基于IP地址等局数据的资源池系统接入权限控制:一支持基于用户名和密码的资源池系统接入权限限制:一运维管理平台必须保证仅有合法用户可对授权的资源进行访问和操作。4.9.3业务数据安全
运维管理平台应具备有良好的安全机制保障业务数据的安全性,严格控制业务数据的直接访问,并必须定期对业务数据进行内部备份或备份到外部存储器等。4.9.4物理设备安全
组成运维管理平台的设备安全性应满足设备的网络安全、主机安全、操作系统安全、数据库安全、应用安全等,具体如下:
一设备应具有访问控制的功能,运维管理平台中各主机应具备分级访问控制功能,根据不同级别的管理员提供相应密码口令,同时对管理员的操作需要有详细的轨迹记录;任何远程登录用户的口令均必须具有有效期配置功能:一设备应支持接受外置4A系统的管理(包括:账号口令管理、认证、授权、审计):一一设备应具有日志功能并可以审计用户的操作:一设备支持防止自身受到的拒绝服务攻击:一设备应支持对流经其自身的流量进行控制的能力:当对设备操作系统或应用系统的安全漏洞进行补丁加载时,应不影响设备正常的工作:设备应具有防病毒能力:防病毒软件应具备全面查杀病毒,查杀病毒准确无误,管理方便,病毒特征码自动更新,安装简单的特点:一当有非法访问或系统安全性受到破坏时必须告警。4.10其他要求
4.10.1可用性
平台能够满足业务和服务质量的需要以及能够可靠地运行可靠性,包括:一可以为用户提供长时间不中断的、可用的服务:一要求具备高可用性能力,满足用户的要求。8
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。