GB/TXXXXX-200X
ICS35.240.20
中华人民共和国国家标准
GB/TXXXX-200X
中文办公软件文档格式规范
Specification for the Chinese office file format(报批稿)
200X-XX-XX发布
国家质量监督检验检疫总局
200X-XX-XX实施
GB/TXXXXX-200X
1范围
2规范性引用文件
3术语和定义
4整体结构,
5文档格式标准schema格式.
5.1文档格式标准schema基本结构5.2文档格式规范元素和类型说明6文档存储格式规范.
6.1文档存储规范基本结构
6.2压缩和打包的实现方式
6.3支持的文件格式
6.4支持的压缩算法
参考文献
(规范性附录)
(规范性附录)
(规范性附录)
(规范性附录)
(规范性附录)
(规范性附录)
(规范性附录)
(规范性附录)
(规范性附录)
(规范性附录)
(资料性附录)
XML文档类型定义
用户XML数据支持方案
多语种支持方案.…
功能扩展支持方案
域代码定义
数字格式的格式码描述
数字格式枚举说明.
图案(纹理)填充枚举
预定义图形类别枚举..
电子表格函数定义.
可能涉及的专利清单
GB/TXXXXX-200X
本标准附录A、附录B、附录C、附录D、附录E、附录F、附录G、附录H、附录I、附录J为规范性附录,附录K为资料性附录。本标准由中华人民共和国信息产业部提出。本标准由中国电子技术标准化研究所归口。本标准的起草单位:中国电子技术标准化研究所、中国科学院软件研究所、北京信息工程学院、珠海金山软件股份公司、无锡永中科技有限公司、北京红旗中文贰仟软件技术有限公司、北京九州软件有限公司、上海中标软件有限公司。本标准的主要起草人:吴志刚、李宁、丁蔚、陈建明、黄芳、王长胜、李健萍、成修治、赵菁华。
GB/T XXXXX-200X
本标准的发布机构提请注意如下事实,声明符合本标准时,可以使用涉及的相关专利(参见附录K)。
本标准的发布机构对于专利的范围、有效性和验证资料不提出任何看法。专利持有人已向本标准的发布机构保证,他愿意同任何申请人在合理和非歧视的条款和条件下,就使用授权许可证进行谈判。在这方面,该专利持有人的声明已在本标准的发布机构备案。有关资料可从可下地址获得:联系人:赵菁华
通讯地址:北京市安定门东大街1号邮政编码:100007
电子邮件:
[email protected]电话:+861084029795
传真:+861084029948
请注意除上述已经识别出的专利外,本标准的某些内容有可能涉及专利。本标准的发布机构不承担识别专利的责任。I
1范围
中文办公软件文档格式规范
GB/TXXXXX-200X
本标准规定了基于XML的中文办公软件文档格式标准。此处的中文办公软件包括文字处理、电子表格和演示文档应用。
本标准适用于中文办公软件文档格式和存储格式的定义,支持不同的中文办公软件之间的兼容和文档互换。
规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB13000.1-1993
信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面(idtISO/IEC10646-1:1993)信息技术文件描述和处理语言超文本置标语言(HTML)GB/T18792-2002
(idtIS0/IEC15445:2000)
GB/T18793-2002
3术语和定义
信息技术可扩展置标语言(XML)1.0(neqW3CRFC-xml-19980210:1998)
下列术语和定义适用于本标准。3.1
可扩展置标语言eXtensibleMarkupLangugeXML
定义语义标记的规则,这些标记将文档分成许多部件并对部件加以标识。作为元标记语言用于定义与特定领域有关的结构化标记语言的句法语言。3.2
命名空间
namespace
在XML文档中,对元素和属性通过赋予一个有两个部分名称进行标识的手段。第一部分是名字空间,第二部分是功能名称。名字空间标识一组名称,以防止出自不同来源去纳入同一XML文档中的具有相同功能名称的多个对象发生混淆。各种典型的名字空间引用统一资源定位符(URI),因为每一个URI都是惟一的。参见REC-xml-names-19990114。3.3
文档类型定义
schema
GB/TXXXXX-200X
种用于限定文档结构(如元素的顺序、出现次数、属性等)的机制,用于描述一类实例文档的结构。分析器可以根据schema来验证文档。本标准中特指w3c制定的Schema标准REC-xmlschema-0-20010502Part0-2。3.4
元素element
在诸如HTML和SGML之类的标记语言中,一组标记、标记之间的内容以及标记所含的所有属性的组合。
属性attribute
文档类型定义的基本构成部分,用于给一个具体元素实例添加信息或修改其信息的一个名称-值对。
组Group
文档类型定义的构成部分,包括元素组和属性组,定义多个元素或属性构成的组合。3.7
类型type
文档类型定义的基本构成部分,用以描述元素特征的、单独抽取以便其他元素共用的元素和属性集合,分为复杂类型和简单类型3.8
可扩展式样语言eXtensibleStylesheetLanguageXSL
由W3C组织制定的用于定义XML文档转换和显现的系列标准。包括:XSLT、XPath、XSL-FO三部分。
可扩展样式单语言转换语言ExtensibleStylesheetLanguage TransformationsXSLT
种用于将现有的XML文档转化为重构的XML文档的语言。注:XSLT由万维网联盟于1999年制定,主要用作XSL的组成部分。XSL描述借助于XSLT转化将文档样式化为XML文档。参见REC-xslt-19991116。3.10
式样单stylesheet
一套指令集合,主要用于规定XML文档显现格式,也可以将一个XML文档转换成另一个文档。
统一资源定位符uniformresourcelocatorsURL
网络环境下引用资源的统一的方法。4整体结构
本标准定义了基于XML语言的中文办公软件文档格式的规范化描述及其物理存储方式,称为统一办公文档格式(UniformOfficeFormat,UoF)。本标准包括三个组成部分,即以xML文2
GB/T XXXXX-200X
档类型定义语言定义的文档格式标准、文档物理存储的打包格式和支持文档格式标准定义的规范性附录。文档格式规范的构成见图1:用户XML数据
支持方案
文档格式标准Schema
功能扩展支持方案
多语种支持方案
文档存储格式规范
域代码规范
数字格式码规范
数字格式枚举说明规范
图案(纹理)填充枚举值规范
自选图形枚举规范
电子表格函数说明
图1文档格式规范的构成
www.bzxz.net本标准的第5章以规范性描述文件(扩展名为xSd)的结构为线索,刻画了文档的体系结构:说明了文档类型定义包含的元素和属性的特征。每个规范性描述文件构成独立的命名空间,作为管理和控制元素和属性集合的基本单元,一个符合标准的文档通过引用多个命名空间中的元素和属性定义文档的实例。
本标准的第6章说明了基于XML的中文办公软件文档存储格式规范,即采用物理存储格式的基本结构。物理存储格式扩展名为uof,采用了压缩存储的方法,方便大型文档的处理和文档交换,在本标准中采用的字符集为GB/T13000.1。在本标准的规范性附录部分描述了文档格式规范的辅助性功能定义,包括如下内容:附录A为描述中文办公软件文档格式的完整的文档类型定义(Schema)。附录B为用户XML数据支持方案,支持用户定义的逻辑文档结构XML数据。如果用户通过办公软件编辑带有逻辑格式的文本片断,本标准将独立存储描述此逻辑文本的数据元结构,并以标识符关联的方法与物理文本联系起来,从而形成同时支持物理文档和逻辑文档的统一文档,附录C为功能扩展支持方案,支持用户功能扩展能力。本标准目前仅支持中文办公软件基本功能的定义,为了鼓励用户的功能创新,支持用户的个性化功能,本标准提供了扩展机制。用户通过扩展机制描述个性化的功能,同样也是符合标准的。附录D为多语种支持方案,支持多语种版本管理。本标准的主版本是中文,对于其他语言版本的支持通过在规范定义的元系和属性中加入唯一标识符,可以方便地通过自动化处理工具形成多种语言版本的规范,从而支持标准的国际化。为了完成文档格式的规范化描述,在附录E至H中还定义了包括域代码规范、数字格式码规范、数字格式枚举说明规范、图案(纹理)填充枚举值和预定义图形类型值及名称说明等。附录E为域代码定义。为了表示文档中可能发生变化的数据,需要采用域代码来标识文档中某个数据块的内容,并通过通用开关、格式开关、数字格式开关以及日期时间格式开关来说明域所标识数据块的特征。本标准定义了标准的域代码和域开关,符合本标准的文档通过相同的域功能描述,可以实现交换过程中无损失的域功能表达。3
GB/TXXXXX-200X
附录F为数字格式的格式码描述。文学处理软件通常会处理多种形式的数字格式,包括常规型、数值型、货币型、会计型、日期型等等。在描述格式信息时,通常采用以字符串表示的格式码来实现,格式码通过约定的格式来表示一定的意义。本标准通过规划化的格式码描述和组织来表达不同的数字格式,保证了数字格式描述的统一性。附录G为数字格式枚举说明。文字处理对于同二个数字在描述上可能有多种方式,包括阿拉伯数字、罗马数字等等,本标准通过枚举的方式定义了规范化的描述方式列表,从列表中选择特定的描述方式就可以保证交换过程中其他的文字处理软件可以正确的显示和解析。附录H为图案(纹理)填充枚举和预定义图形枚举。本标准定义了文档中的图案(纹理)填充、预定义图形类型的标准化模板编号,以减少对于填充图案和预定义图形内容的描述中的复杂性。在文档中只需要标示出相应的编号,就可以通过文字处理软件重现图案和预定义图形的特征。
附录I描述了本标准所支持的预定义图形种类。附录J为电子表格函数说明。描述了电子表格中的函数名称、作用与语法。附录K为标准涉及的专利清单。
本标准规定的Schema在下次正式修订之前,可能会不定期更新,关于最新版本请参见:http://egs.org.cn/uof/。5文档格式标准schema格式
5.1文档格式标准schema基本结构5.1.1 uof.xsd
uof.xsd是构成文档格式标准的基本模块之一,定义了独立的命名空间,包括文字处理、电子表格和演示文档三种办公应用共同具有的基本要素。5.1.1.1命名空间
目标命名空间:
5.1.1.2元素与类型
停止引用
5.1.2字.xsd
http://schemas.uof.org/cn/2003/uof复杂类型
书签类型
修订信息类型
元数据类型
字体声明类型
式样表类型
纸张类型
超级链接类型
边框类型
边框线类型
页边距类型
简单类型
度量单位类型
式样类型
百分比类型
纸张方向类型
线型类型
长度类型
颜色类型
字,xsd是构成文档格式标准的基本模块之一,定义了独立的命名空间,主要包括文字处理使用的基本要素,但同时也提供给其他应用文档格式描述使用。5.1.2.1命名空间
目标命名空间:
5.1.2.2元素与类型
http://schemas.uof.org/cn/2003/uof-wordproc元素
文字表
逻辑章节
5.1.3表.xsd
复杂类型
主体类型
位置类型
修订信息类型
公用处理规则类型
分栏类型
分节类型
删除类型
制表位设置类型
区域引用类型
单元格属性类型
单元格类型
句属性类型
句式样类型
句类型
域代码类型
域开始类型
域结束类型
尾注设置类型
批注类型
文字处理文档类型
文字表属性类型
文字表式样类型
文字表类型
文档设置类型
段落属性类型
段落式样类型
段落类型
用户类型
缩进类型
脚注尾注类型
脚注设置类型
自动编号类型
自动编号集类型
节属性类型
行属性类型
行类型
逻辑章节类型
锚点类型
页眉页脚类型
首字下沉类型
简单类型
单元格垂直对齐类型
字符位置类型
数字格式类型
文字排列方向类型
文字表对齐类型
节垂直对齐方式类型
节类型类型
视图类型
GB/TXXXXX-200X
属性组
式样属性
表,xsd是构成标准的基本模块之一,定义了独立的命名空间,主要包括电子表格使用的基本要素,但同时也提供其他应用文档格式描述使用。5.1.3.1命名空间
GB/TXXXXX-200X
目标命名空间:
5.1.3.2元素与类型
操作码
第一操作数
第二操作数
5.1.4演.xsd
http://schemas.uof.org/cn/2oo3/uof-spreadsheet复杂类型
公用处理规则类型
分组类型
刻度类型
单元格式样类型
单元格类型
图表类型
坐标轴类型
对齐格式类型
工作表内容类型
工作表属性类型
工作表类型
数值类型
数据有效性类型
数据标志类型
数据点类型
条件格式化类型
标题类型
校验条件类型
电子表格类型
筛选类型
页面设置类型
简单类型
偏移量
刻度标志
刻度线类型
区域类型
单元格值
单元格数据类型
命名表达式
图例位置
垂直对齐
数值分类名称
文字方向
文字旋转角度
显示单位
普通筛选类型
条件操作符
标题名
校验类型
水平对齐
系列产生类型
缩进量
网格线类型
随动方式
页眉页脚位置
属性组
数字格式
演.xsd是构成标准的基本模块之一,定义了独立的命名空间,主要包括演示文档使用的基本要素,但同时也提供其他应用文档格式描述使用。5.1.4.1命名空间
目标命名空间:
5.1.4.2元素与类型
http://schemas.uof.org/cn/2003/uof-slideshow复杂类型
主体类型
动画类型
幻灯片备注类型
幻灯片类型
放映设置类型
文本式样类型
母版类型
演示文档类型
配色方案类型
页面版式类型
简单类型
运动方向
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。