GB/T 43208.1-2023
基本信息
标准号:
GB/T 43208.1-2023
中文名称:信息技术服务 智能运维 第1部分:通用要求
标准类别:国家标准(GB)
英文名称:Information technology service—Intelligent operation and maintenance—Part 1:General requirements
标准状态:现行
发布日期:2023-09-07
实施日期:2024-04-01
出版语种:简体中文
下载格式:.pdf .zip
下载大小:18958718
相关标签:
信息技术
服务
智能
运维
通用
标准分类号
标准ICS号:信息技术、办公机械设备>>35.080软件开发和系统文件
中标分类号:电子元器件与信息技术>>信息处理技术>>L77软件工程
关联标准
出版信息
出版社:中国标准出版社
页数:40页
标准价格:65.0
相关单位信息
起草人:金磐石、林磊明、王立新、杨晓勤、钟捷、陈奇、史晨阳、彭晓、曾宏祥、邓曙光、李世宁、孙永敬、包航宇、王士强、侯岳、王岗、孙纪周、吴勇、冯震、石婷婷、徐静雯、陈俊、樊涛、谭立科、徐徽、吴基科、李保旭、肖国彬、孔再华、迟鲲、武威、王勇、石庆宏、潘进、莫秀刚等
起草单位:中国建设银行股份有限公司、平安科技(深圳)有限公司、中国光大银行股份有限公司、中国电子技术标准化研究院、国泰君安证券股份有限公司、上海浦东发展银行股份有限公司、清华大学、招商证券股份有限公司、广东省农村信用社联合社、中国银联股份有限公司等
归口单位:全国信息技术标准化技术委员会(SAC/TC 28)
提出单位:全国信息技术标准化技术委员会(SAC/TC 28)
发布部门:国家市场监督管理总局 国家标准化管理委员会
标准简介
本文件确立了智能运维框架,规定了智能运维组织的组织治理、智能运维场景实现和能力域的通用要求。
本文件适用于:
a)组织识别智能运维活动,评估自身条件和能力;
b)智能运维组织自身建设、管理和评估;
c)第三方对智能运维组织进行测量和评价。
标准内容
ICS35.080
CCS L 77
中华人民共和国国家标准
GB/T43208.1—2023
信息技术服务
智能运维
第1部分:通用要求
Information technology serviceIntelligent operation and maintenancePart1:Generalrequirements
2023-09-07发布
国家市场监督管理总局
国家标准化管理委员会
2024-04-01实施
GB/T43208.1—2023
规范性引用文件
术语和定义免费标准下载网bzxz
智能运维框架
框架图
智能特征
组织治理
组织策略
管理方针
组织架构
组织文化
相关方需求和期望
智能运维场景实现
场景分析
场景构建
场景交付
效果评估
能力域
数据管理能力域
分析决策能力域
自动控制能力域
附录A(资料性)
附录B(资料性)
参考文献
常见智能运维场景说明
场景能力解析示例
GB/T43208.1—2023
本文件按照GB/T1.12020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
本文件是GB/T43208《信息技术服务智能运维》的第1部分。GB/T43208已经发布了如下部分:
第1部分:通用要求。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。本文件起草单位:中国建设银行股份有限公司、平安科技(深圳)有限公司、中国光大银行股份有限公司、中国电子技术标准化研究院、国泰君安证券股份有限公司、上海浦东发展银行股份有限公司、清华大学、招商证券股份有限公司、广东省农村信用社联合社、中国银联股份有限公司、北京农村商业银行股份有限公司、中信银行股份有限公司、中国农业银行股份有限公司、广发银行股份有限公司、国家电网有限公司、新华三技术有限公司、云智慧(北京)科技有限公司、北京必示科技有限公司、上海翰纬信息科技有限公司、国网数字科技控股有限公司、中国民生银行股份有限公司、恒丰银行股份有限公司、中国邮政储蓄银行股份有限公司、泰康保险集团股份有限公司、中国民用航空局信息中心、中国民航信息网络股份有限公司、中国人寿保险股份有限公司上海数据中心、交通银行股份有限公司、北京银行股份有限公司、华夏银行股份有限公司、四川新网银行股份有限公司、徽商银行股份有限公司、中国人民银行清算总中心、人保信息科技有限公司、中国人民财产保险股份有限公司、太平金融科技服务(上海)有限公司、海通证券股份有限公司、东方证券股份有限公司、光大证券股份有限公司、长江证券股份有限公司、南方电网数字电网研究院有限公司、云南电网有限责任公司信息中心、招商局金融科技有限公司、中国国际航空股份有限公司、中国移动通信集团浙江有限公司、湖南友道信息技术有限公司。本文件主要起草人:金磐石、林磊明、三立新、杨晓勤、钟捷、陈奇、史晨阳、彭晓、曾宏祥、邓曙光、李世宁、孙永敬、包航宇、王士强、侯岳、王岗、孙纪周、吴勇、冯震、石婷婷、徐静雯、陈俊、樊涛、谭立科、徐徽、昊基科、李保旭、肖国彬、孔再华、迟鲲、武威、王勇、石庆宏、潘进、莫秀刚、钱程、魏理蒙、王晨、是煊、郭宝贤、汤海华、郭鑫伟、王野平、裴丹、股康、黎杰松、徐晟、冯一欣、叶璞钰、夏立民、继东、姚润程、付谦、耿鹏、张丹青、赵璐琪、马萌、陈学先、罗大勇、盛红雷、任毅、张舒伟、侯铮、陈健、华波、孔令国、王凯波、张威、张超、罗劲岚、邓鬼、王峰磊、孙磊、戴凯明、朱学良、陆壮飞、马威、蒋恩平、何超、武志飞、王乾伟、尼米智、孙玉峰、黄渊、杨理国、王吉玲、高羽杰、李泳江、刘博、李进武、姚玉强、周为伟、杨超、孙伟、周睿、卢伟开、向华伟、毛正雄、陈春润、周锋、李晨辉、魏晓铭、付家乐、李富、杨敏、李光、陆兴海、王书航、曹立、温希道、曾彬、文吉刚、陈宏峰、孙翊威、张晓慧。GB/T43208.1—2023
随着人工智能、大数据、云计算等技术的飞速发展,运行维护服务正从制度与流程驱动向数据与算法驱动的智能运维时代演进,智能运维作为人工智能在运行维护领域的重要应用,是运维领域的全新方式。
智能运维的实现以组织治理为引领、以场景实现为中心、以能力域构建为支撑,将能力项应用于具体场景,对场景进行数字化、自动化、智能化赋能,并在场景的实现过程中对能力项进行优化和改进,这是基于智能运维最佳实践提炼出的创新的、切实有效的方法。其中,数据是构建智能运维的基石,算法是挖掘数据价值的关键,技术是实现智能运维的手段。据此,本文件提出智能运维框架,并针对数据、算法、技术三个智能运维能力的关键要素从治理层面提出要求。各部分之间的关系如图1所示。智能运维能力要求
智能运维要素
信息技术服务智能运维
第2部分:运维数据治理
信息技术服务智能运维第1部分:通用要求信息技术服务智能运维
第3部分:运维算法治理
图1GB/T43208各部分之间的关系GB/T43208拟由4个部分构成。
信息技术服务智能运维
第4部分:运维技术治理
第1部分:通用要求。目的是为智能运维组织提供智能运维框架,指导组织从组织治理、智能运维场景实现和能力域三个方面开展智能运维建设,持续提升智能运维水平,实现运维目标。第2部分:运维数据治理。目的是为智能运维组织提供运维数据治理框架,指导组织对能力域中的数据要素进行治理,为智能运维建设提供高质量的运维数据,有效地支撑智能运维场景的实现。
第3部分:运维算法治理。目的是为智能运维组织提供运维算法治理框架,指导组织对能力域中的算法要素进行治理,为智能运维建设提供安全、可靠、有效的运维算法,挖掘运维数据的价值,赋能运维场景的实现。
第4部分:运维技术治理。目的是为智能运维组织提供运维技术治理框架,指导组织对能力域中的技术要素进行治理,为智能运维建设提供技术应用的原则、方法和要求,支撑智能运维场景的实现。
1范围
信息技术服务智能运维
第1部分:通用要求
GB/T43208.1—2023
本文件确立了智能运维框架,规定了智能运维组织的组织治理、智能运维场景实现和能力域的通用要求。
本文件适用于:
组织识别智能运维活动,评估自身条件和能力;a)
智能运维组织自身建设、管理和评估;b)
第三方对智能运维组织进行测量和评价。2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T28827.1
术语和定义
第1部分:通用要求
信息技术服务
运行维护
GB/T28827.1界定的以及下列术语和定义适用于本文件。3.1
intelligent operation and maintenance智能运维
具备能感知、会描述、自学习、会诊断、可决策、自执行、自适应等若干人工智能特征的运维服务。3.2
智能运维场景
intelligentoperationandmaintenancescenarios为实现特定的运维目标,并体现智能特征,所需的人员、活动与对象的组合。3.3
people
从事智能运维工作的相关人员。注:人员包括智能运维领域的运维人员、研发人员和管理人员等。[来源:GB/T28827.1—2022,3.4,有修改]3.4
organization
为实现智能运维目标,由职责、权限和相互关系构成自身功能的实体或虚拟团队。3.5
技术technology
实施智能运维的工具、系统和相关架构等1
GB/T43208.1—2023
注:技术包括数据切片、异常点过滤、缺失点补充、关联分析、统计分析、可视化展示工具:流程控制、权限管理系统海量数据读写的分布式、批处理架构等。3.6
process
为实现智能运维,将输人转化为输出的一项或一组相互关联且有序的活动。3.7
知识knowledge
来源于理论和实践,经过积累、梳理、总结并被验证的,供智能运维应用消费的理解、规律、洞见、逻辑、结论等、
注:知识包括总结出的策略、方法、模板、规范、规则、机制、专家的运维经验、系统架构图等3.8
算法algorithm
面向智能运维场景,可被计算机系统识别为具体的指令,并在有限的时间内执行和输出结果的一种解决具体问题的策略和机制。
注:算法包括机器学习、深度学习、类脑智能计算等3.9
数据data
智能运维活动中对相关事物的性质、状态以及相互关系的记录。注:数据包括指标数据、日志数据、拓扑数据、调用链数据、配置管理数据以及工单数据等。3.10
资源resource
为交付智能运维服务所依存的计算、网络、存储等物质要素。3.11
元数据
metadata
关于数据或数据元素的数据(可能包括其数据描述),以及关于数据的拥有权、存储路径、访问权和数据易变性的数据。
[来源:GB/T36073—2018,3.83.12
datamodel
数据模型
对运维数据的抽象,用来描述运维数据的特征、结构和相互间关系。3.13
数据质量dataquality
在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。[来源:GB/T36344—2018,2.3]4智能运维框架
4.1概述
智能运维框架由组织治理、智能运维场景实现、能力域三部分构成,其中,组织治理包括组织策略、管理方针、组织架构、组织文化、相关方需求和期望,智能运维场景实现包括场景分析、场景构建、场景交付和效果评估四个过程,能力域包括数据管理、分析决策、自动控制等能力域,每个能力域由若干能力项构成,每个能力项由人员、技术、过程、数据、算法、资源、知识7个能力要素构成。2
GB/T43208.1—2023
组织需在组织治理要求的指导下,遵循智能运维场景实现的需求,规划和建设智能运维能力。通过数据管理能力域提供的高质量数据,结合分析决策能力域做出的合理判断或结论,驱动自动控制能力域执行运维动作,组合形成具备智能特征的运维场景,持续提升智能运维水平,实现质量可靠、安全可控、效率提升、成本降低等运维目标。框架图
智能运维框架见图2。
智能运维场景实现
组织治理
组织策略
管理方针
组织架构
组织文化
相关方需
求和期望
智能特征
智能特征
实现过程
能力要素
能感知
场最分析
数据管理
能力项
会描述
自学习
场景构建
会诊断
能力域
分析决策
能力项
图2智能运维框架
可决策
场最交付
自执行
自适应
效果评估
自动控制
能力项
智能运维需具备若干智能特征,智能特征包括:能感知、会描述、自学习、会诊断、可决策、自执行、自适应:
能感知是指能够灵敏、准确、自动地识别和反映人、活动和对象的状态;会描述是指能够直观友好地编排、展现和表达运维场景中各类信息;自学习是指能够挖掘数据、完善模型、总结规律,主动沉淀知识;会诊断是指能够对人、活动和对象进行分析定位并判断原因;可决策是指能够通过信息搜集、加工和综合分析,给出后续依据或解决方案;自执行是指能够对运维场景自动进行分析、判断、决策和处理;自适应是指能够自动识别环境变化,动态调配应对措施,并优化处理。组织治理
组织通过组织策略、管理方针、组织架构、组织文化及相关方需求和期望对其组织进行完善,以指导3
GB/T43208.1—2023
组织开展智能运维能力的建设和智能运维场景的实现5.2
组织策略
组织应建立提升智能运维能力的策略,包括:a)遵循企业战略的组织愿景、目标和规划;b)
智能运维的应用范围;
管理原则。
5.3管理方针
组织应在管理原则的指导下建立智能运维方针,包括:基于总体规划和分步实施的原则,按照“近期、中期、远期”的建设路径,总体规划、整合资源、统a)
一目标,分阶段、分步骤进行建设,建立以数据度量为核心的持续运营和改进机制,实现业务价值;
基于以人为本的原则,管理和技术应用并重,注重用户体验,积极使用先进技术提升运维的智b)
能化水平,同时优化组织流程,实现人员的技能提升和价值体现;基于效率和安全平衡发展的原则,在安全可控的前提下,逐步提高效率和优化性能,充分考虑c)
智能运维手段失效情况下的操作风险,制定并采取及时有效的补偿策略和应对方法。5.4组织架构
组织应建立符合智能运维管理要求的组织架构,包括:管理层:指导制定智能运维建设的方针、目标和计划,并推动组织成员进行学习、理解和贯彻a)
执行;
b)专家团队:负责智能运维体系的总体规划和架构管控,解决需求争议,指导能力建设;建立健全智能运维工作机制和管理制度,推广创新模式;建立智能运维成效评价机制并定期评估,施行闭环管理;
研发团队:承担智能运维研发工作;d)运维团队:管理和执行智能运维活动。5.5组织文化
组织应建立符合智能运维持续发展的组织文化,包括:制定规章制度,使其与智能运维建设的价值理念相一致;a)
具备培训机制,定期对组织内部人员进行智能运维相关技术的培训,持续提升人员的技能水平;
具备协作机制,建立跨领域、跨部门、跨职能的融合协作机制,制定价值共享、责任共担的激励c
约束机制,促进智能运维能力供方与需方的良性互动;d)具备评估机制,建立可量化、可验收的智能运维成效评价和考核方法,定期对能力建设、场景运行、价值目标达成等情况进行监测分析,优化和调整实施策略;e)对智能运维相关知识产权进行保护,如内部控制、申请专利、商标、软件著作权等。5.6相关方需求和期望
组织应明确智能运维不断变化的组织环境,包括:智能运维组织相关方;
b)相关方与智能运维相关的需求和期望GB/T43208.1—2023
注:相关方的需求和期望可包括与智能运维相关的服务、规范、绩效、法律、法规要求和合同义务。6智能运维场景实现
6.1概述
智能运维场景实现是围绕质量可靠、安全可控、效率提升、成本降低的运维目标,通过场景分析、场景构建、场景交付、效果评估四个关键过程,建设智能运维场景(以下简称“场景”)的一组活动。它通过迭代调优,持续提高运维智能化程度。常见智能运维场景说明见附录A,场景能力解析示例见附录B。场景分析是指通过前期调研和评估,确定场景构建方案和计划的过程。a)
场景构建是指按既定方案和计划开展场景相关能力建设的过程。b)
场景交付是指场景构建完成后进行实施交付及配套活动的过程。c)
效果评估是指场景交付后检查是否达到预期效果,并设定下阶段迭代目标的过程。6.2场景分析
组织在进行场景分析时,应遵守以下要求:明确预期场景实现目标,如提高管理质量、降低故障时间、提升运维效能、节省人力成本、提升a)
用户体验等;
评估场景实现的可行性,包括成本、收益、资源投人等;b)
识别场景实现的共性需求,优先采用平台化建设思路,避免功能重复建设:d)
评估相关场景对现状的影响,如组织、过程、相关方等,并制定风险应对措施;e)
根据场景复杂度、技术实现难度、数据质量情况、资源支持情况、需求紧迫性等,明确场景构建的阶段和步骤,混合场景可拆分成多个单一场景分阶段实现;f)
重点评估数据需求,结合场景特点,确定所需数据的时效要求、质量要求、数据范围、采集方法、存储方式等;
重点评估安全要求,考虑数据访问权限控制、信息保密、模型修正、失效补偿等;以合理的颗粒度拆解场景涉及到的具体活动,可采用列举、分析、归纳等方法,识别场景实现的h)
运维角色、运维活动、运维对象、智能特征等;i)
基于数据管理、分析决策、自动控制能力域,确定待建设的能力项和待提升的能力要素;j
设立可评估或可量化的指标,如故障发现准确率、平均故障修复时间等:k)
根据场景分析的结论,形成场景构建方案和计划。6.3场景构建
组织在进行场景构建时,应遵守以下要求:按照场景构建方案和计划,研发、优化、建设相关能力项;a)
根据具体场景进行能力项组合,重点关注能力项的可复用性:c
确保场景构建过程可追溯,交付结果可计量或可评估;d)
重点关注数据质量和模型运行效果,如海量数据采集、多源数据集成、复杂模型训练等;e)
对于涉及自动化和批量操作的场景,增加必要的约束措施,设计安全控制点和回退功能;f)
测试和验证关键场景的高可用性,并制定失效补偿措施;将规则知识、专家经验、模型训练结果等固化到信息系统中;g
GB/T43208.1—2023
h)关注各系统间的数据打通和流程联动,避免产生数据壁垒;i)通过敏捷迭代的方式开展场景构建,运维需求与工具研发紧密融合。6.4场景交付
组织在进行场景交付时,应遵守以下要求:按既定计划完成场景实施交付,交付物包括交付方案、使用手册、应急预案等;a)
开展培训工作,如场景的使用、运维、应急处理等;b)
开展试点和推广工作;
开展测试验收工作;
开展关键指标适配、调优工作,如资源交付的效率、根因定位的准确率等。6.5
5效果评估
组织在进行效果评估时,应遵守以下要求:a
建立评估机制,组织相关方开展效果评估;b)评估已建场景是否满足既定目标,对未达目标或指标的情况开展原因分析,包括智能特征、能力域、能力项、能力要素等;
与利益相关者建立顺畅的沟通渠道,对意见做好收集与反馈;d)评估已建场景是否满足运维相关安全要求;制定改进措施和提升计划,并持续改进、快速选代e
7能力域
数据管理能力域
7.1.1概述
数据管理能力域是对运维数据进行全生命周期管理和应用的能力组合,提供高质量、全覆盖、互联融合且满足时效性要求的运维数据。该能力域包括以下8个能力项:a)
数据建模一一基于对运维数据的理解和分析需要,抽象运维数据特征,对运维数据的层次化架构、数据对象以及对象关系进行标准化定义和线上化持续管理的能力;b)
元数据管理一一对数据及信息资源的描述性信息进行管理,形成数据资产管理目录的能力;数据采集一通过技术手段对原始运维数据进行获取的能力;c)
数据加工
对运维数据进行清洗、转换、聚合、脱敏等处理的能力;数据存储
一一按照数据存储标准在计算机的存储装置或外围的存储设备中存储海量离线与实时运维数据的能力;
质量管理一一对运维数据在计划、获取、存储、共享、维护、应用和消亡的各阶段中可能存在的数据质量问题,进行识别、度量、监控、预警和处置,提高数据质量的能力;数据服务——提供运维数据消费接口及自服务的能力;g)
数据安全一一一基于数据安全相关策略和流程,利用技术和管理手段,对运维数据的安全风险进行防范和处置的能力。
7.1.2数据建模
7.1.2.1人员
组织在数据管理能力域数据建模中,对于人员管理,应遵守以下要求:a)
识别关键责任人,负责组织协调相关方制定数据建模方案和计划;GB/T43208.1—2023
识别或指派运维各专业领域人员,承担智能运维场景的数据需求分析工作;识别或指派模型设计人员,承担数据模型的设计工作;c)
识别或指派模型审核人员,承担数据模型的审核工作:识别或指派模型研发人员,承担物理模型等的研发工作;识别或指派模型维护人员,承担数据模型的日常维护工作。技术
组织在数据管理能力域数据建模中,对于技术管理,应遵守以下要求:针对不同数据需求,采用适宜的技术或管理手段,对数据分布情况进行分析;a)
采用适宜的数据建模工具,完成数据模型的定义、设计及开发;c)
采用适宜的数据模型管理工具或配置管理工具等,维护模型的准确性、有效性和可回性。过程
组织在数据管理能力域数据建模中,对于过程管理,应遵守以下要求:a)
定义建模数据收集和梳理过程,明确场景数据需求;b)
定义建模流程,包括主题域建模、概念建模、逻辑建模或物理建模等;c
针对数据模型进行评审、优化和变更管控,满足运维业务需求、标准性、可读性等要求7.1.2.4
组织在数据管理能力域数据建模中,对于数据管理,应收集并分析数据建模过程中形成的数据,评价数据建模过程的绩效,如主题域的覆盖率。7.1.2.5算法
组织在数据管理能力域数据建模中,对于算法管理,应采用适当的算法,满足数据建模的需要。7.1.2.6资源
组织在数据管理能力域数据建模中,对于资源管理,应根据数据建模的规模、功能、性能、安全性等要求配置适当的资源,包括计算、网络、存储等。7.1.2.7知识
组织在数据管理能力域数据建模中,对于知识管理,应遵守以下要求:a)
根据不同来源的数据,总结出可复用的数据模型设计方法、数据标准与管理方法;根据不同数据模型,总结出标准的主题域模型、概念模型、逻辑模型及物理模型等。b)
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。