GB/T 42147-2022
基本信息
标准号:
GB/T 42147-2022
中文名称:政府网站网页电子文件元数据
标准类别:国家标准(GB)
英文名称:Metadata for webpage electronic document of government website
标准状态:现行
发布日期:2022-12-30
实施日期:2023-07-01
出版语种:简体中文
下载格式:.pdf .zip
下载大小:15389036
相关标签:
政府
网站
网页
电子
文件
数据
标准分类号
标准ICS号:信息技术、办公机械设备>>信息技术应用>>35.240.01信息技术应用综合
中标分类号:电子元器件与信息技术>>信息处理技术>>L72数据元表示方法
关联标准
出版信息
出版社:中国标准出版社
页数:76页【胶订-大印张】
标准价格:95.0
相关单位信息
起草人:朱彬、章建方、黄秋华、温志凡、李佳临、陈其胜、刘光富、马益洪、李鹤、史根强、陈煌、陈亚军、刘伟丽、缪仙玉、高武龙、王坚、薛馨枫、纪卫平、张朋越、龙嘉洋、卢义、刘欣、刘大伟、顾大正
起草单位:广东省惠州市质量技术监督标准与编码所、烟台嘉量信息服务有限公司、中国标准化研究院、福建艾思欧信息科技有限公司、深圳市感知未来科技有限公司、浪达网络科技(浙江)有限公司、浙江方易校准检测技术有限公司等
归口单位:全国电子业务标准化技术委员会(SAC/TC 83)
提出单位:全国电子业务标准化技术委员会(SAC/TC 83)
发布部门:国家市场监督管理总局 国家标准化管理委员会
标准简介
本文件规定了政府网站网页电子文件的元数据集,以及网页电子文件元数据的扩展原则和方法。
本文件适用于政府网站网页电子文件规范化管理,也适用于政府机构和相关企业事业机构据此开发相关网页电子文件管理系统,记录和保存网站网页电子文件信息。
标准内容
ICS35.240.01
CCS L 72
中华人民共和国国家标准
GB/T42147—2022
政府网站网页电子文件元数据
Metadata for webpage electronic document of government website2022-12-30发布
国家市场监督管理总局
国家标准化管理委员会
2023-07-01实施
GB/T42147—2022
2规范性引用文件
3术语和定义
缩略语
网页电子文件元数据实体及其结构5.1
网页电子文件元数据实体及其之间相互关系网页电子文件实体的元数据
网页电子文件管理机构人员实体的元数据网页电子文件记录的业务实体的元数据网页电子文件管理过程的元数据网页电子文件操作权限实体的元数据实体相互关系的元数据
6描述元数据元素的属性
网页电子文件相关实体元数据元素的描述7.1
网页电子文件实体元数据元素的描述次
网页电子文件管理机构人员实体元数据元素的描述网页电子文件记录的业务实体元数据元素的描述网页电子文件管理过程元数据元素的描述网页电子文件操作权限实体元数据元素的描述实体相互关系元数据元素的描述·网页电子文件元数据XMLSchema
8网页电子文件元数据扩展原则和方法·8.1元数据扩展原则·
8.2元数据扩展方法
附录A(资料性)网页电子文件元数据XMLSchema参考文献
GB/T42147—2022
本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
本文件由全国电子业务标准化技术委员会(SAC/TC83)提出并归口。本文件起草单位:广东省惠州市质量技术监督标准与编码所、烟台嘉量信息服务有限公司、中国标准化研究院、福建艾思欧信息科技有限公司、深圳市感知未来科技有限公司、浪达网络科技(浙江)有限公司、浙江方易校准检测技术有限公司、北京新国信软件评测技术有限公司(国家电子政务系统质量检验检测中心)、自然资源部信息中心、北京冠群信息技术股份有限公司、杭州市标准化研究院、浙江物联网产业协会、惠州市智同达信息技术有限公司、深圳大学、中国电子技术标准化研究院、中国计量大学、广东深威企业管理服务有限公司、绍兴科艺标准技术咨询有限公司。本文件主要起草人:朱彬、章建方、黄秋华、温志凡、李佳临、陈其胜、刘光富、马益洪、李鹤、史根强、陈煌、陈亚军、刘伟丽、缪仙玉、高武龙、王坚、薛馨枫、纪卫平、张朋越、龙嘉洋、卢义、刘欣、刘大伟、顾大正。
1范围
政府网站网页电子文件元数据
GB/T42147—2022wwW.bzxz.Net
本文件规定了政府网站网页电子文件的元数据集,以及网页电子文件元数据的扩展原则和方法本文件适用于政府网站网页电子文件规范化管理,也适用于政府机构和相关企业事业机构据此开发相关网页电子文件管理系统,记录和保存网站网页电子文件信息。2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T7408数据元和交换格式信息交换日期和时间表示法
GB32100法人和其他组织统一社会信用代码编码规则GB/T33190电子文件存储与交换格式版式文档3术语和定义
下列术语和定义适用于本文件。3.1
网站网页
webpage
超文本置标语言标签的纯文本文件。L来源:GB/T39677—2020,3.1.2,有修改注:网页通常是HTML格式,是网页浏览器对HTML解释后生成的包含文字、表格、图片、音视频、动画、脚本等资源的流式电子文件。
网页版式电子文件
fixedlayoutelectronicdocument网页内容信息被排版在预定义页面中,具有显示一致性的版面固定的电子文件。注:网页版式电子文件是网页电子文件的一种类型,网页电子文件可以是HTML、PDF、OFD、WARC等格式类型L来源:GB/T39677—20203.1.5
webpageelectronicdocument
网页电子文件
从网页上获取的,HTML格式的电子文件,或经过OFD、WARC等格式转换的电子文件。注:网页通常是HTML格式,网页版式电子文件通常是OFD或PDF格式,网页和网页版式电子文件都是网页电子文件的类型。网页电子文件可以是原始HTML格式的网页,也可是网页为便于归档保存而转化或固化为其他格式的文件。
对事实、概念或指令的一种形式化表示,适用于以人工或自动方式进行通信、解释或处理。1
GB/T42147—2022
[来源:GB/T18391.1—2009,3.2.6,有修改]3.5
attribute
一个对象或实体的特征。
[来源:GB/T18391.1—2009,3.1.1]3.6
valuedomain
允许值的集合。
[来源:GB/T18391.1—2009,3.3.38]3.7
数据类型
datatype
-些可区分的值的集合,这种区别由这些值的特性以及对这些值的运算所表征。[来源:GB/T18221—2000,4.11]3.8
entity
任何已经存在的、将要存在的或可能存在的具体的或抽象的事物,包括事物间的联系。[来源:DA/T46—2009.3.11]
机构人员
负责或参与文件形成、处理和管理的机构/人员3.10
元数据
metadata
定义和描述其他数据的数据。
来源:GB/T18391.1—2009.3.2.163.11
元数据元素
metadata element
元数据的最基本的单元,可通过标识、定义、约束性、值域等一组属性描述的数据单元。[来源:DA/T46—2009,3.5,3.6,有修改]3.12
元数据子集
metadata section
相互关联的若干元数据元素、简单或复合的元数据实体组成的集合。4缩略语
下列缩略语适用于本文件:
HTML:超文本置标语言(HyperTextMarkupLanguage)OFD:开放式版式文档(OpenFixedlayoutDocument)PDF:便携式文档格式(PortableDocumentFormat)URL:统一资源定位符(UniformResourceLocator)WARC:互联网存档(WebARChivefile)XML:可扩展置标语言(ExtensibleMarkupLanguage)2
5网页电子文件元数据实体及其结构5.1
网页电子文件元数据实体及其之间相互关系网页电子文件元数据实体
网页电子文件元数据实体包括:a)
网页电子文件实体的元数据;
网页电子文件管理机构人员实体的元数据;网页电子文件记录的业务实体的元数据;网页电子文件管理过程的元数据;网页电子文件操作权限实体的元数据;实体相互关系的元数据。
网页电子文件元数据实体相互关系网页电子文件元数据实体相互关系见图1。网页电子文件管理
过程的元数据
网页电子件操竹
网页电子文件管理
机构人员实体的元数据
权限实体的元数据
GB/T42147—2022
网页电子文件
实体的元数据
网页电子文件记录的业务
实体的元数据
图1网页电子文件元数据实体及其之间相互关系5.2
网页电子文件实体的元数据
网页电子文件实体的元数据见表1。表1
类别(元数据实体)
网页电子文件实体的元数据
网页电子文件实体的元数据
元数据子集
内容描述
分类方式
文件类型
标识类型
标识名称
标识符
标题名称
元数据元素
GB/T42147—2022
类别(元数据实体)
网页电子文件实体的元数据
网页电子文件实体的元数据(续)元数据子集
主题词
内容描述
形式特征
电子属性
网页电子文件管理机构人员实体的元数据网页电子文件管理机构人员实体的元数据见表2。表2
网页电子文件管理机构人员实体的元数据
部门名称
格式信息
软件环境
硬件环境
数字化参数
网页电子文件管理机构人员实体的元数据元数据子集
人员名称
人员描述
机构描述
网页电子文件记录的业务实体的元数据网页电子文件记录的业务实体的元数据见表3。人员代码
职务名称
角色名称
机构类型
元数据元素
元数据元素
机构统一社会信用代码
机构名称
表3网页电子文件记录的业务实体的元数据元数据元素
业务名称
网页电子文件记录的业务实体的元数据5.5
网页电子文件管理过程的元数据网页电子文件管理过程的元数据见表4。表4
业务时间
业务描述
业务执行人
网页电子文件管理过程的元数据元数据子集
版式文件转化
网页电子文件管理过程的元数据归档
采集时间
网站名称
链接地址
栏目名称
频道名称
专题名称
GB/T42147—2022
元数据元素
采集格式名称
采集格式版本
目标格式名称
目标格式版本
转换软件名称
格式转换时间
版式文件大小
归档范围
归档时间
归档提交人
归档接收人
归档格式
子宗名
子类名
子卷名
GB/T42147—2022
网页电子文件管理过程的元数据(续)元数据子集
封装方式
封装时间
存储与备份
网页电子文件管理过程的元数据处置
网页电子文件操作权限实体的元数据网页电子文件操作权限实体的元数据见表5封装包格式
封装责任者
聚合层次
存储位置
保管期限
备份标识
备份方式
备份周期
元数据元素
备份存储媒体
处置触发条件
处置行为
处置原因
创建者
创建时间
审批者
审批日期
生效日期
修改者
修改日期
表5网页电子文件操作权限实体的元数据类别
网页电子文件操作权限实体的元数据5.7实体相互关系的元数据
实体相互关系的元数据见表6。
权限名称
权限描述
权限有效时间
元数据元素
实体相互关系的元数据
描述元数据元素的属性
实体相互关系的元数据
关系类型
关系标识符
关系名称
关系描述
元数据元素
GB/T42147—2022
本文件参考GB/T18391.3—2009,采用表7所示的属性对元数据元素进行描述。表7
属性名称
描述元数据元素的属性
属性描述
按一定规则排列的元数据元素的顺序号编号
中文名称
英文名称
约束性
出现次数
数据类型
数据格式
缺省值
本文件采用的编号规则为MEXXXXXX,其中ME是代表元数据,“XXXXX×”为6位数字编号,前面2位数字代表元数据类别的顺序号,中间2位数字代表元数据子集的顺序号,后面2位数字代表元数据元素的顺序号元数据元素的中文名称
元数据元素的英文名称
元数据元素含义的描述
说明采用该元数据元素的强制性程度,分“必选”、“可选”。“必选”表示必须采用;“可选”指根据用户需要选用或不选用元数据元素是否可以重复出现,以及重复出现的次数。本文件出现次数用“最小出现次数..最大出现次数”表示,N表示无限大的次数描述元数据元素的所有取值的类型描述该元数据元素的信息格式应遵循的规则本文件采用如下记法表示数据格式:A代表大写字母(A到Z);a代表小写字母(a到z);n代表数字(0到9);I代表整数;D代表十进制小数。
-C代表包括汉字、字母、数字在内任意字符。例如C.200表示最长200字符。日期时间格式采用GB/T7408的基本格式或扩展格式元数据元素可能取值的范围
元数据元素默认的取值
GB/T42147—2022
网页电子文件相关实体元数据元素的描述7.1
网页电子文件实体元数据元素的描述网页电子文件分类
分类方式
网页电子文件的分类方式见表8。表8
属性名称
中文名称
英文名称
约束性
出现次数
数据类型
数据格式
缺省值
文件类型
网页电子文件的文件类型见表9。表9
属性名称
中文名称
英文名称
约束性
出现次数
分类方式
ME010101
分类方式
modeofclassification
属性描述
网页电子文件按照何种属性特征进行分类的方法必选
字符型
文件类型
属性描述
ME010102
文件类型
documenttype
按照网页电子文件的某种属性特征进行分类必选
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。