ICS35.240.01
CCS L 70
中华人民共和国国家标准
GB/T39677—2020
OFD在政府网站网页归档中的应用指南Guideline for OFD application to government website webpage archiving2020-12-14发布
国家市场监督管理总局
国家标准化管理委员会
2021-07-01实施
规范性引用文件
术语、定义和缩略语·
政府网站适用OFD归档的建设技术建议4
网页元素
网页元素转化为OFD版式文件的范围网页元素转化成OFD版式文件的规则政府网站网页归档需考虑因素
附录A(规范性)
参考文献
HTML标签与OFD版式文件元素的对应关系表GB/T39677—2020
GB/T39677—2020
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由全国电子业务标准化技术委员会(SAC/TC83)提出并归口。本文件起草单位:宁波市档案馆、中国标准化研究院、北京海泰方圆科技股份有限公司、清华大学深圳国际研究生院、深圳市龙华区政务服务数据管理局、宁波市标准化研究院、北京数科网维技术有限责任公司、杭州市标准化研究院、清华大学、中国电子技术标准化研究院、广东省惠州市质量技术监督标准与编码所、中国计量大学、成都理邦系统工程技术有限公司、百望股份有限公司、上海中信信息发展股份公司、大连标准化研究院有限公司。本文件主要起草人:王海娟、章建方、吴建港、金雷、马益洪、黄必清、柳晶、刘丹、陈亚军、薛四新、张韧、王霄翔、张鑫、朱彬、朱培武、冯辉、康柳、姜海舟、李秀、袁嘉新、柴俊涛、曾祺惠、朱云龙、潘况、唐超、田皓婕、杨雅鑫。
GB/T39677—2020
中共中央办公厅、国务院办公厅关于印发《国家电子文件管理“十三五”规划》的通知(厅字【2016]37号)中明确要求推进政府网页等电子文件管理。国务院办公厅关于印发《政府网站发展指引》通知(国办发【2017]47号)中也明确要求对有价值的历史网页进行归档处理。本文件的制定,旨在贯彻落实国家相关文件精神,推广GB/T33190一2016的开放版式文档格式(OpenFixedlayoutDocument,简称OFD)的应用,加强各级政府部门对有价值的网站网页进行有效归档管理。
1范围
OFD在政府网站网页归档中的应用指南GB/T39677—2020
本文件提供了政府网站适用OFD归档的建设技术建议,给出了网页元素及其转化为OFD版式文件的范围和规则,以及政府网站网页归档需考虑因素。本文件适用于政府网站网页开发建设,并以OFD版式文件格式对政府网站网页进行归档保存,其他类型网站网页建设及其归档保存可参考使用。规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T26163.1信息与文献文件管理过程文件元数据第1部分:原则GB/T33190-一2016电子文件存储与交换格式版式文档3术语、定义和缩略语
3.1术语和定义
GB/T33190一2016界定的以及下列术语和定义适用本文件3.1.1
government website
政府网站
各级人民政府及其部门、派出机构和承担行政职能的事业单位在互联网上开办的,具备信息发布、解读回应、办事服务、互动交流等功能的网站。【来源:国务院办公厅关于印发政府网站发展指引的通知(国办发[2017]47号)]3.1.2
webpage
包含超文本语言标签的纯文本文件。3.1.3
webpagearchiving
网页归档
将网站中对国家和社会具有保存价值的网页信息进行收集、整理、移交接收的过程。[来源:DA/T802019,3.1]
电子文件
electronicdocument
国家机构、社会组织或个人在履行其法定职责或处理事务过程中,通过计算机等电子设备形成、办理、传输和存储的数字格式的各种信息记录。注:电子文件由内容、结构、背景组成。[来源:GB/T18894—2016,3.1,有修改]GB/T39677—2020
网页版式电子文件fixedlayoutelectronicdocument网页内容信息被排版在预定义页面中,具有显示一致性的版面固定的电子文件。注:网页版式电子文件是网页电子文件的一种类型,网页电子文件可以是HTML、PDF、OFD、WARC等格式类型。
[来源:DA/T47—2009.3.1.有修改]3.1.6
网页元素
webpageelements
网页中用以组织网页结构和表达网页内容的对象。3.2
缩略语
下列缩略语适用于本文件。
AVI:音频视频交错格式(AudioVideoInterleaved)GIF:图像互换格式(GraphicsInterchangeFormat)JPEG:一种连续色调静止图像的数字压缩编码格式,全称为联合图像专家组(JointPhotographicExperts Group)
MP3:一种音频压缩编码标准文件格式,全称为运动图像专家组音频压缩的第三层编码(MovingPicture Experts Group Audio Layer I)MP4:一种用于音频、视频压缩编码文件格式,全称为运动图像专家组第4代系列标准(MovingPicture Experts Group 4)
OFD:开放式版式文档(OpenFixedlayoutDocument)PDF:便携式文档格式(PortableDocumentFormat)PNG:可移植网络图形格式(PortableNetworkGraphicFormat)WARC:互联网存档(WebARChiveFile)WAV:波形音频文件格式(WaveformAudioFileFormat)4政府网站适用OFD归档的建设技术建议为便于政府网站网页归档保存采用OFD版式文件,网站建设时宜从网站结构和网页内容元素两方面进行考虑,并建议遵循以下原则。网站网页结构设计技术建议
1)网页层级结构不宜过于复杂,网页层级不宜超过三级;2)网页层级宜按照政府网站网页所反映的业务分类方法或规范进行组织。网页内容元素选取建议
网页宜符合W3CHTML5.0规范,便于抓取网页文件实体元数据;1
2)宜按照可完整转化、可部分转化、不可转化为OFD版式文件的顺序选取网页内容元素进行网站建设;
网页文件实体元数据宜按照GB/T26163.1的规定提供,便于抓取;网页图片宜采用PNG、JPEG、静态GIF格式;网页音频宜采用MP3、WAV格式;网页视频宜采用MP4、AVI格式。5网页元素
网页结构元素
组织网页结构的元素主要有:
导航:网页文档中的指引性链接:b)
节:网页文档的某个区域,如章节、头部、底部或者文档的其他区域:c)
层:网页文档中的一个分隔区块或者一个区域部分,常用于组合块级元素;表格(布局):网页文档中用于控制页面布局的一种方式,边框通常不可见;d)
列表:网页文档中用于排版,使得列项整齐有序;GB/T39677—2020
头部:网页文档或者文档的部分区域的页眉,常用于介绍内容或者导航链接栏的容器;底部:网页文档或者文档的部分区域的页脚。g)
网页内容元素
表达网页内容的元素主要有:
文本:网页中的信息是以文字为主的,如中文简体、中文繁体和英文等b)
表格:由行、列和单元格形式组织的内容;c
超级链接:从一个网页指向另一二个自的端的链接,自的端可以是网页,也可以是图像、电子邮件地址、文件和程序等;
图像/图片:网页中可以是各种格式的光栅静态图像,通常有JPEG、PNG、静态GIF等格式:图形:网页中的矢量图形;
动画:网页中的动态图像/图形,通常有GIF动画、脚本动画、画布动画等形式g)
音频:网页中的声音文件,通常有MP3、WAV等格式;h)
视频:网页中连续的动态图像文件,通常有AVI、MP4、WMV等格式;i)
表单:网页中用于实现数据采集功能,并将这些数据发送到目标端的网页元素;编程:网页中用于定义客户端脚本,通常有JavaScript、VBScript等脚本;k)嵌入对象:嵌入网页中的插件对象或浏览器扩展程序,通常有ActiveX、Object等方式。5.3
网页元素的HTML标签类型
网页元素通常以HTML标签的形式表现。政府网站网页元素的HTML标签主要类型见表1。表1政府网站网页元素的主要HTML标签类型序号
基本标签
格式类型标签
文档类型标签
标题标签
网页体标签
文本样式标签
文本居中标签
文本强调标签
HTMLTag
排版元素
静态内容元素
静态内容元素
静态内容元素
GB/T39677—2020
表单类型标签
框架类型标签
图像类型标签
音视频类型标签
链接类型标签
列表类型标签
表格类型标签
样式区域标签
信息标签
编程标签
政府网站网页元素的主要HTML标签类型(续)标签
窗体标签
输人控件标签
多行输入框标签
框架窗标签
内嵌框架窗标签
框架组标签
图片标签
画布标签
图像映射标签
音频标签
视频标签
超级链接标签
外部资源链接标签
无序列表标签
有序列表标签
表标签
行标签
单元格标签
样式标签
层标签
头区域标签
头信息标签
元数据标签
脚本标签
内嵌对象标签
备注中网页元素见6.2、6.3、6.4。HTMLTag