GB/T 18391.2-2003
标准分类号
标准ICS号:信息技术、办公机械设备>>35.040字符集和信息编码
中标分类号:综合>>基础标准>>A24分类编码
出版信息
出版社:中国标准出版社
书号:155066.1-20149
页数:8页
标准价格:10.0 元
出版日期:2004-04-11
相关单位信息
首发日期:2003-07-25
复审日期:2004-10-14
起草单位:中国标准研究中心
归口单位:全国信息技术标准化技术委员会
发布部门:中华人民共和国国家质量监督检验检疫总局
主管部门:国家标准化管理委员会
标准简介
本部分提供了使数据和分类模式相关联的操作步骤和方法,以便将注册机构能够更好地运用分类模式。 GB/T 18391.2-2003 信息技术 数据元的规范与标准化 第2部分: 数据元的分类 GB/T18391.2-2003 标准下载解压密码:www.bzxz.net
本部分提供了使数据和分类模式相关联的操作步骤和方法,以便将注册机构能够更好地运用分类模式。
标准内容
GB/T 18391.2—2003/IS0/IEC 11179-2 :2000前言
GB/T18391《信息技术数据元的规范与标准化》分为六个部分:一第1部分:数据元的规范与标准化框架,一—第2部分,数据元的分类;
第3部分:数据元的基本属性;
一第4部分:数据定义的编写规则与指南;一一第5部分:数据元的命名和标识愿则;一一第6部分:数据元的注册。
本部分为GB/T18391的第2部分,等同采用国际标准ISO/IEC11179-2:2000信息技术数据元
的规范与标准化第2部分:数据元的分类》(英文版)。对于ISO/IFC11179-2:2000,本部分还做了下列编辑性修改:a)删除了1S0/IFC11179-2:2000前言。根据中文习惯,将英文中斜体部分的内容放在引号之中。h)
c)对1S0/IEC11179-2:2000范围中出现\国家信息标准组织(NISO)”,由于在我国自前尚不存在此类机构,故予以删除,并作了相应的文字处理。本部分由中国标准研究中心提出并归口。本部分起草单位:中国标准研究中心。本部分主要起草人:邢立强、刘植婷、李小林、冯卫1
GB/T18391.22003/IS0/IEC11179-2:2000引言
GB/T18391的本部分将通过一组具体的属性为编写数据元分类方面的文档提供依据,就分类模式的设计、并据此建立和推广分类结构而言,存在众多的尝试。出于本部分的目的,关键字、主题词表、分类法和本体论均为经过认真考虑的分类模式,且各自具有不同的鉴别力。与数据元的各方面一起使用时,这分类模式将发挥巨大的作用。对数据元进行分类有儿个目的:分类可帮助用户从众多的数据元中找出某个单的数据元;方便对数据元进行数据管理分析:通过继承使原本借助其他属性(如名称和定义)不能完整表述的语义内容得以表送。
本部分所含分类模式的作用在于:—派生和形成抽象数据元和应用数据元,;—确保适当属性和属性值的继承;从参照词汇表中派生名称
——消除歧义;
一辨识上位类、同位类和下位类的数据元概念,—辨识数据元概念和数据元之间的关系;一辅助模块化设计的名称和定义的开发。以上所提到的每一分类模式都有其长处和短处,并为确立其特定作用奠定基础。例如:关键字有勤于用产引用潜在有用数据元的快捷方式;主题词表是一种更结构化的方式,便描述性术语编排于觉的、窄的和相关分类类的结构中;分类法提供了一种分类结构,该结构具有从一般分类到暴体分类含义继承的功能:与相关的认识论一起,本体论将提供丰富而又定义严格的结构(如具有多个继承的有向非循环图)可以传递软件组件所需的信息,如智能主体(intelligentagents)和介体(mediators),而这些有助于为智能信息服务提供条件。术语“数据元”用于指代“数据元类型”,简写仅为方便而已。iiiKAoNiKAca-
1范围
GB/T 18391.2--2003/IS0/IEC 11179-2:2000信息技术数据元的规范与标准化第2部分:数据元的分类
GB/T18391的本部分提供使数据和分类模式相关联的操作步骤和方法。数据元的几个组成成分导致了对分类的需求。GB/T18391所涵盖的组分包括对象类、特性、表示、值域、数据元概念以及数据元本身。本部分中详述的步骤与方法将使注册机构能够更好地运用分类模式:一—分析对象类、数据元概念和数据元;一在对象类、特性、表示、数据元概念以及数据元间进行比较;减少数据元概念和数据元的多样性;一明确无误地识别、描述和定义数据元概念和数据元;——辅助用于指定注册状态的数据元分析;一一解决同义词和多义词的有关问题;…一于数据注册处检索数据元概念和数据元;—…·-辨识数据元概念和数据元之间的关系;-一一支持唯一的且明确无误的标识和引用对象类、数据元概念和数据元,其形式应做到语言上的中立和应用到信息技术上的可能。GB/T18391的制定也出于对标准化的数据设计程序的需要,以确保数据元能够支持电子数据交换。
本部分确定了一系列原则、方法和程序,用于阐明在为某个数据元的各个组分与分类模式间联系提供文件时(最基本)的需求。这包括分类模式的名称、非智能标识符、定义和其他方面及其内容。这些可以通过属性集的使用来获得。本部分将阐述一些特定的属性以及这些属性内容的结构。用户在必要时,可以扩展该属性集。分类法或本体论可以带有附加信息,例如,为了更加全面地限定具体数据元的分类法,提供可用于对象类、特性或表示分类单元的建议性限定符集。本部分依据并使用GB/T18391第3部分的基本属性。
3.4中所包含的例子表明如何通过此处阐述的属性将选出的数据元组分与分类模式联系起来。一个或多个分类模式的使用,旨在为开发可以提高语义精度和设计完整性的元数据提供一个合理的概念基础。
本部分并不确立一一个特定的分类模式作为范例。认可一项具体的分类方法和(或)具体的认识论并不包括在本部分的范围之内。它们由其他的标准委员会制定,适于某个特别的研究领域。分类模式的功能及其内容的使用具有可竞争性。其他标准委员会正在或已经开发的用于分类的规范语言和(或)具体的技术手段和结构也可为本部分所容纳,例如,具体用于开发主题词表的标准,可适于任何所编制的分类结构中主题词表的开发及扩展和维护。这些属性可以依据可扩展性原则被加之于本部分所阐明的属性之中,但它们并不包含在此,正如GB/T18391.6的描述和规定,每个注册机构可以依据分类模式、结构以及它认为合适的内容对数据元的组分进行分类。在文档化数据元的分类方面,注册机构应依据本部分规定的原则、方法、程序和属性进行。
2术语和定义
下列术语和定义适用于GB/T18391的本部分。1
GB/T 18391.2---2003/ISO/IEC 11179-2:20002.1
属性attribute
某个对象或实体的特征。
分类模式 classification scheme依据对象所具有的共同特征,如:起源、组成、结构、应用和功能,而对其进行的排列或划分。2.3
分类模式项classification scheme item分类模式中内容的组分。免费标准下载网bzxz
注:这可以是分美法或本体论的一个节点,主题词表中的一个术语等!2.4
分类的组分classified component依据一个或多个分类模式可对其进行分类的个数据元的任何组分。注:组分包括对象类、特性、表示类、数据元概念、域和数据元。2.5
数据data
对事实、概念或指令的一种形式化表示,适于人工或自动方式进行通信、解释或处理(引自GB/T5271.1)
数据元data element
用一组属性描述其定义、标识、表示和允许值的数据单元。2.7
数据元概念dataelement contept能以数据元的形式表示,且与任何特定的表示法无关的概念。2.8
名称name
人们标识事物和概念的基本手段。3数据元的分类爆性
属性的使用应使各分类模式与数据元选定的组分联系起来。这些组分包括对象类、特性、表示、数据元概念以及数据元本身。正如在GB/T18391.1中描述的那样,数据元概念由个或多个对象类与一个特性间的关系组成。为一个数据元概念选择种表示形式(例如,一个数字码)后就形成了数据元。每个组分可以与下述的分类模式关联。3.1关键字
关键字作为基本属性包括在GB/T18391.3中。它们可应用于对象类、特性、表示、数据元和数据元概念。GB/T18391,3对关键字做了如下描述:名称:关键学
定义:用于数据元检索的一个或多个有意义的字词。约策:条件选。
数据类型:字符串。
备注:本属性可用来记录与正被讨论的数据元相关联的关键字。适用于本部分的看的,“参照词表”一在此,词表中的每个词都限定为“个具体的含义能够以同样的方式记录为关键字。尽管关键字如同分类模式一样不稳固,但却很有用,能够作为一个“分类模2
-i KAoNni KAca-
武类型”记录下来并使用于本标准中。3.2主题词表术语
GB/T 18391.2---2003/IS0/IEC 11179-2:2000主题词表术语能够与数据元和数据元概念关联起来。本标准并没有规定主题词表的结构。3.4中阐述的属性可以用来捕捉与数据元或数据元概念关联的主题词表信息。3.3分类法和本体论分类单元
分类法是基于概化或特化以及集、子集和集隶属关系这样的数学概念的概念或分类单元的层次结构。本体论是关于分类单元的网状结构,目的在于为自然界某些部分提供模型,由关手对象的类别、对象特性以及自然界中该部分对象间可能联系的理论组成。个本体论可以包括对分类单元的解释以及对符合语法规则的使用做出限定的正式通则。分类法和本体论中的分类单元可能与下列已分类的数据注册组分相关联:对象类,特性、表示类和数据元概念。本部分并不阐明分类法或本体论的结构,但是,列于3.4中的属性将被用来把握此类结构信息。3.4分类属性
记录一个数据元任何组分的分类信息可能用到下列属性:被分类组分标识符,
被分类组分名称,
分类模式类型;
分类模式名称;
—分类模式版本;
分类模式项类型;
—-分类模式项值。
例如:
被分类组分标识符对象类的标识符(如,CC0001)一被分类组分名称一对象类(如,果蝇);·分类模式类型一分类法;
一分奖模武名称国际分类信息系统(生物分类法)分类模式版本=2.1;
分类模式项类型一分类单元标识符:分类模式项值一5411
分类模式项类型一分类单元术语;分类模式项值一果蝇。
图1刻画了分类属性间的关系。附加属性可能会在需要时被用到。3
GB/T18391.2--2003/IS0/IEC11179-2:2000 CC0001
标识符
一对象粪(姆,巢)
被已分类组
被分类
标识符
CS0001
3.5分类属性描述
鼓描述
分类模式
国际分类信意
系统(生物)
3.5.1名称:被分类组分标识符
三分类法
管理组分的分类属性及其用法示例一分类单元术语
分类模式项
定义:在语言上中性的、唯一的且明确无误的标识符,用于标识和引用某个已分类组分。约束:条件选。
条件:如果分类项将被记录则为必要。数据类型:字符串。
备注:示例:CC0001。
3.5.2名称:被分类组分名称
定义:以分类为条件的数据元组分的名称,如对象类、特性、表示类、值域、数据元概念和数据元。约束:条件选。
条件:如果分类项将被记录则为必要。数据类型:字符串。
备注:示例:对象类。
3.5.3名称:分类模式类型
定义;从抽取分类项的分类模式的类型。约束:条件选。
条件:如果分类项将被记录为必要。数据类型:字符串。
备注:示例:分类法。
-iKAoNiKAca-
3.5.4名称:分类模式标识符
GB/T 18391.2—2003/ISO/IEC 11179-2:2000定义:在语言上中性的、唯的且明确无误的标识符,用于标识和引用某个已分类组分约束:条件选。
条件:如果分类项将被记录则为必要。数据类型:字符串。
备注示例:CS0001。
3.5.5名称:分类模式名称
定义:从中抽取分类项的特定分类模式的名称。约束:条件选。
条件:如果分类项将被记录则为必要。数据类型:字符串。
备注:示例:Kenworthey分类法。3.5.6名称:分类模式版本
定义:从中抽取分类项的特定分类模式的版本。约束:条件选。
条件:如果分类项将被记录则为必要。数据类型:字符串。
备注:示例:“版本2.1”。
3.5.7名称:分类模式项类型
定义:3.5.8中“分类模式项值”的类型。约束:条件选。
条件:如果分类项将被记录则为必要。数据类型:字符串。
备注:示例:“非智能标识符”、“术语”、“定义”。3.5.8名称:分类模式项值
定义:一个分类模式项的名称、标识符或定义等的一个实例。约束:可选。
条件:如果分类项已被记录则为必须。数据类型:字符串。
备注:示例:在分类法的分类单元中,“5411”就是“非智能标识符”类型值的例子,“果蝇”就是用来标识分类法中节点的“术语”类型值的例子。5
GB/T 18391.2---2003/ISO/IEC 11179-2:2000参考文献
GB/T5271.4信息技术
词汇第4部分:数据的组织(eqvISO/IEC2382-4)第1部分:数据元的规范与标准化框GB/T18391.1—2002
2信息技术数据元的规范与标准化架(idt ISO/IEC 11179-1:1999)GB/T 18391.3-2001
GB/T18391.6-—2001
信息技术数据元的规范与标准化性(idt ISO/IEC 11179-3:1994)第3部分:数据元的基本属
信息技术数据元的规范与标准化第6部分:数据元的注册(idtISO/IEC 11179-6:1997)
-ii KAoNi KAca=
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。