首页 > 卫生行业标准(WS) > WS/T 305-2009 卫生信息数据集元数据规范
WS/T 305-2009

基本信息

标准号: WS/T 305-2009

中文名称:卫生信息数据集元数据规范

标准类别:卫生行业标准(WS)

标准状态:现行

发布日期:2009-01-22

实施日期:2009-08-01

出版语种:简体中文

下载格式:.rar.pdf

下载大小:3039977

标准分类号

关联标准

出版信息

出版社:人民卫生出版社

标准价格:20.0 元

出版日期:2009-08-01

相关单位信息

发布部门:卫生部

主管部门:卫生部

标准简介

本标准规定了数据集概述、卫生信息数据集元数据规范、元数据内容框架、卫生信息数据集核心元数据、元数据子集、引用信息与代码表。本标准适用于作为医药卫生领域数据集属性的统一规范化描述,也可用于医药卫生领域针对数据集制定专用元数据标准的依据。 WS/T 305-2009 卫生信息数据集元数据规范 WS/T305-2009 标准下载解压密码:www.bzxz.net

标准图片预览






标准内容

ICS11.020
备案号:25594—2009
中华人民共和国卫生行业标准
WS/T305—2009
卫生信息数据集元数据规范
Metadata specification of health information dataset2009-01-22发布
人民卫健业服
2009-08-01实施
中华人民共和国卫生部发布
2规范性引用文件
3术语和缩略语
3.1术语
3.2缩略语…
4数据集概述
4.1数据集基本概念
4.2卫生信息数据集
5卫生信息数据集元数据概述
5.1元数据内容组成
5.2元数据结构层次
5.3元数据的摘要描述
5.4适用功能*
6元数据内容框架
卫生信息数据集核心元数据
7.1概述
7.2摘要描述
8卫生信息数据集参考元数据:
8.1元数据根实体
8.2元数据子集
9引用信息与代码表
9.1引用信息·
9.2代码表
附录A(资料性附录)卫生信息数据集核心元数据著录示例附录B(规范性附录)卫生信息数据集元数据扩展原则与方法参考文献
WS/T305—2009
WS/T305—2009
本标准参考《都柏林核心元数据元素集(版本1.1)》、ISO19115《地理信息元数据》、ISO/
IEC19501《信息技术开放式分布处理通用建模语言(UML)(版本1.4.2)》和GB/T19710—2005《地理信息、元数据》的基础上,结合卫生信息领域数据集的特性进行编写。本标准的附录A是资料性附录,附录B是规范性附录。本标准由卫生部卫生信息标准专业委员会提出。本标准由中华人民共和国卫生部批准。本标负责起草单位:中国人民解放军总医院。本标雁主要起草人:刘丽华、金水高、胡建平、胡凯、张黎黎、王骏、饶克勤。1范围
卫生信息数据集元数据规范
WS/T305-2009
本标准规定了卫生信息数据集元数据内容框架、卫生信息数据集核心元数据,卫生信息数据集参考元数据、引用信息与代码表。
本标准适用于作为卫生信息数据集属性的统规范化描述,也可作为医药卫生领域针对数据集制定专用元数据标准的依据。
2规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注口期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。GB/T2260—2002中华人民共和国行政区划代码GB/T7408一2005数据元和交换格式信息交换日期和时间表示方法WS/T306—200卫生信息数据集分类与编码规则RFC2396统一资源定义符:通用语法3术语和缩略语
下列术语和缩略语适用于本标准。3.1术语
3.1.1元数据metadata
定义和描述其他数据的数据。
3.1.2数据集dataset
具有一定生题,可以标识并可以被计算机化处理的数据集合。3.1.3元数据元素metadataelement元数据的基本单元。
3.1.4元数据实体metadataentity组说明数据相同特性的元数据元素。可以包含一个或若干个元数据实体。3.1.5元数据子集metadatasection元数据的子集合,由相关的元数据子集和元数据元素组成。3.1.6数据元dataelement
用一组属性规定其定义、标识、表示和允许值的数据单元。3.2缩略语
XML(extensiblemarkuplanguage)可扩展标记语言。4数据集概述
4.1数据集基本概念
对数据集概念的详细解释可见WS/T306—2009。4.2卫生信息数据集
对卫生信息数据集的闸述可见WS/T306—2009。1
WS/T305—2009
5卫生信息数据集元数据概述
5.1元数据内容组成
批擎,
卫生信息数据集元数据规定了两个层次的元数据内容的集合:核心元数据与参考元数据,其中参考元数据包含了核心元数据,它们之间的内容包含关系见图1。卫生信息数据集
心元数据
卫生信自数据集会考元数据
5.2元数据结构层次
老元数据实体和元数据子集
元数据结构:元数据无
元数据元素是元数据的量
基本的信息单元。
例如,数据集名称,数据集标识等、元数据创建日期等,是最基本的属性信息单元1元数据元素元数据实体是同头号
来表示
完数据元素的集合
需要组合者干个更加基本的信息来表达的属性。方”需要“单位名称”“联系人”联系电话”“通讯地让”等著干个基本信息来例如“数据集提交利发
说明,而数据集“关键词兑明”需要“关键词”和“词典名称”“来兑明,对于“数据集提交和发布方”和“关键词说明”这类属性则用无数据实体来表示。元数据子集自共小
说明数据集某
息、分发信息等。
5.3元数据的摘要描述
5.3.1元数据的摘要描述符
一类属性的元数据元素与元数据实体组成,例如标识信息,内容信主要采用摘要插方法定义和描选卫生信息数据集的元数据内容。摘要措述的方法通过表1所列的描述符,针对元数拥元索、实体与子集进行定义。“约束”表示一个描述符是“必选(M)”,还是“条件选(C)”,或者是“可选”摘要描述待见表1表1摘要描述符
描述符
中文名称
英文名称
数据类型
取值规则
子元素
5.3.2中文名称
描述元数据元素时必选,描述元数据子集、实体时不选描述元数据子集,实体时必选,描述元数据元素时不选元数据了集,实体或元素的中文名称,例如7.2中的标题即为核心元数据的元数据实体或元数据元素的中文名称。
5.3.3定义
描述元数据子集、实体或元素的基本内容,是卫生信息数据集某个属性和特征的概念与说明。2
5.3.4英文名称
元数据子集,实体或元数据元素的英文名称,一般使用英文全称。WS/T305—2009
英文名称中,词汇均采用无缝连写。元数据子集与实体英文名称的每个词汇的首字母均为大写,元数据元素英文名称的首词汇全部小写,其余词汇的首字母采用大写。5.3.5数据类型
对元数据的有效值域和允许对该值域内的值进行有效操作的规定。元数据实体与元数据子集的数据类型为复合型,元数据元素的数据类型包括为数值型、布尔型,字符串、日期型和复合型等。
当元数据元素的数据类型为复合型的时候,表明该元数据元素使用了引用信息中的引用数据类型。引用数据类型是由一组元素组成、能被重复引用的元素集台。例如,“数据集提交和发布方”和“元数据维护方”两个属性,要共同用到“电称、联系人”“联系电话”“通讯地址”“邮政编码”和“电子邮件地址”这一组子元素来表示了表达的方便,卫生信息元效据定义了一个叫做“负责方”的数据类型见9.1.1,供“数据集提交和发布方“和元数据维护方“进行引用。G
5.3.6取值规则
元数据子集、实体或
5.3.7短名
最取值方式的说明。
元数据元素、实休子集的英文缩写名称,具体缩写规则如下:a)短名在本机
围内必须唯
b)对存在国
c)对于根据
行业惯用英文缩写词汇的元数据元素或元数据实体,采用惯用英文缩写作短名名称或自定义的短名,在可以保证其(本标准范围中的所有短名范围内)唯一性的情况下联每个
司汇的前3位字母作为其短名,当如此取词时发现不能够保证短名标识的唯一性延展取词的位数,通常增加士位。如果仍然不能满足唯一性要求,则照此顺延。时,应当
d)元数据子
个词汇的
5.3.8子元素
子元素是通过
素和元数据实体的短名中,词均采用无缝连写。元数据子集与实体短名中每好均为大写,元数据元素短名的首词汇全部小写,其余词汇的首享母采用大写。表示规则以确定一个元数据实体中包含的下一级的元数居实体或元数据元素。表示规则为:“标
由替换、生成
表达式”。表达式中客符号的含义见表2。表2表达式的符号含义
或(选择)在由”\分开的两项中选择具表示()中的元数据元素为可选/条件必选项,且最大出现次数为1若为条件必选项,约束/条件参见其注解表示中的元数据元案.为可选/条件必选顶,日最大出现次数为N:若为条件必选项,约束/条件参见其注解表示元数据元素a为必选项,且最大出现次数为1表示仔中的元数据元素为必选项,且最大出现次数为N在子元素表示中,中均使用元数据元素或实体的中文名称例如:
子元素:关键词说明
1关键词/n+
0(词典名称)1
WS/T305—2009
5.3.9注解
对元数据子集,实体或元素的含义的进一步解释,包括该元数据的约束条件(必选,可选或条件必选)和最大出现次数。当该元数据为条件必选时,应注明其约束条件5.3.9.1约束/条件
以“必选项”“可选项”“条件可选”等文字说明元数据子集实体或元素是“必须(M)”“可选(O)”或者“条件可选(C)”
可选元数据子集或元数据实体可以有必选元数据实体或元素。但这些必选的实体或元素只有当上级的可选子集或实体被选用时才成为必选的,如果上一级的可选元数据子集或实体未被选用,则其所包含的必选实体或元素也不选用。5.3.9.2最大出现次数
说明元数据子集,实体或元素可以重复出现的次数。只允许出现一次的用1”表示,充许重复出现(但重复的次数不是固定值)的用N”表示。不为1的固定出现次数用相应的数字表示,如\2”、“3”“4\等。
5.4适用功能
5.4.1数据集元数据著录
对具体的卫生信息数据集选择元数据内容进行描述时,以核心元数据作为著录(根据必选、可选等约束条件)的基础,然后根据需要可以选择参考元数据的内容进行著录,见图2:卫牛信息数据集
》著录基研
选择使用
核心元数据
必选元素(必缅著录
某个具体
可选元素(选择著录)
卫生信息数据集参考元数据根据需要选择著录图2直接作为著录标准的使用方式卫生信息
数据集的
元数据善
录结果
用户针对卫生信息数据集进行元数据著录的实例,可参见附录A(以只著录核心元数据内容为例)5.4.2制定专用标准的依据
在医药卫生领域内,以数据集为对象制定专用的元数据标准时,可依照本标准进行制定。所制定的数据集专用元数据标准,必须包含核心元数据的内容,同时将参考元数据的内容作为扩展内容的参考,使用方式见图3:
必须包含
>扩展参考
卫生信息数据集核心元数据
卫生信息数据集参考元数据
>制定
医药卫生领域
针对数据集的
专用元数据标准
图3作为制定专用标准依据时的使用方式要在卫生信息参考元数据的基础上继续进行元数据内容的扩展时,应当符合附录B的要求。6元数据内容框架
卫生信息数据集元数据的全集,即参考元数据的内容规定了7个元数据子集,分别如下:4
WS/T305—2009
a)元数据标识信息(子集):包含元数据本身的基本信息,如名称、维护方,创建日期等。b)数据集标识信息(子集):包含元数据所描述的数据集的基本信息,包括名称、标识符,提交或发布方等。
c)内容信息(子集):内容信息提供数据内容特征的描述信息,包括摘要、特征数据元等d)分发信息(子集):分发信息包含有关资源分发者的信息以及用户获取资源的途径。e)数据质量信息(子集):数据生产者有关数据集数据志信息的一般说明,)限制信息(子集):包含对数据集和元数据进行访问和使用的限制信息。g)维护信息(子集):包含关于元数据或数据集的更新频率及更新范围的信息。参考UML类图中聚集关系与依赖关系的表示方法,概要描述了卫生信息数据集参考元数据的内容框架(见图4)。
元数据标识
信息子集
内容信息
数据集标识
信息子集
卫生信息数据
集参考元数据
数据质量
信息子集
分发信息
引用信息
限制信息
维护信息
图4卫生信息参考元数据内容构成子集
7个子集是参考元数据这一整体的组成部分,在图4中标记出了各自的可出现次数。元数据标识信息(了集)数据集标识信息(子集)、限制信息(子集)和维护信息(子集)中有元数据元素使用到了引用信息中由本标准定义的数据类型,所以它们对引用信息存在依赖关系。7卫生信息数据集核心元数据
7.1概述
卫生信息核心元数据包括8个必选元数据元素或实体,10个可选元数据元素与实体。卫生信息数据集核心元数据内容见表3其中的第四列\约束”是指该元数据元素或元数据实体是必选(M)”,或者是“可选(O)”,第五列是说明核心元数据在参考元数据中的相应位置:表3卫生信息数据集核心元数据内容序号
核心元数据内容
数据集名称
数据集标识符
数据集摘要
数据集提交或发布方
关键词说明
元素与实体
在参考元数据中的位置
数据集标识信息子集
数据集标识信息子集
内容信息了集
数据集标识信息集
数据集标识信息于集
WS/T305—2009
核心元数据内容
数据集语种
数据集特征数据元
数据集发布日期
数据集发布格式
在线访间地址
元素与实体
数据集分类
NG HOUSE
相关环境说明
元数据创建日期
元数据标识符
元数据负责方
元数据标准名
元数据标
元数据更
7.2摘要描述
数据集名利
义:能移福
英文名称:da
数据类型:学
在参考元数据中的位置
数据集标识信息子集
内容信息子集
发布信息子集
发布信息子集
发布信息子集
数据集标识信息子集
数据集标识信息子集
后教据标识信息子集
元数据标识信息子集
无数据标信息子集
元数提标识信息子集
元数据标识信息子集
元数据标认信息子集
描述卫生信息数据集主题与内睿的标题Citle
取值规则:自由文本
名:data
解:必选
最大出现次数为1
7.2.2数据集标只得(必选)
义:卫集数据集的唯
英文名称:datasetdntifier
数据类型:字符自
标识符
取值规则:按照“是交松的编号-版本导”的命名规则进行赋值。提交机构使用机构标准名称,版本号用一位整数如两位小数的表示方式,例如“2.10”“(版本。短
名:dataID
7.2.3数据集摘要(必选)
义:数据集内容的简单说明
英文名称:abstract
数据类型:字符串
取值规则:自由文本
名:abstract
解:必选项:最大出现次数为1
7.2.4数据集提交或发布方(必选)定
义:提交或发布数据集,并对数据集的真实性,正确性负责的单位或部门英文名称:datasetContact
数据类型:复合型
取值规则:负责方≤数据类型》(见9.1.1)短
名:dataContact
解:必选项;最大出现次数为Nbzxz.net
7.2.5关键词说明(必选)
义:关键词种类、类型和参考资料定
英文名称:DescriptiveKeywords数据类型:复合型
名:DescKeys
子元素:关键词说明
1关键词
大调OSE
解:必选项;最大出乳N
关键词
义:用于描过数病生题的通用词、形式化词或短诺英文名称:keywo
数据类型:字符
取值规则:自由
名:key
解:必选项
最大出现次数为N
词典名
册的词典名,或类似的权威关键词资料名称定
英文名称:t
esau usName
数据类型:宁
取值规则:自
名:thssame
最大出现次数头
解:可选
7.2.6数据集语种
义:数据集彩力的语言
英文名称:datase Lanage
数据类型:字符申
联值规则:语种代码代鸿(见9.2.1)oa
名:dataLang
7.2.7数据集特征数据元(可选)定
WS/T3052009
义:卫生信息数据集中,能够表达数据集核心内容与特征资源的数据元列举英文名称:characteristicDataElernent数据类型:字符串
取值规则:自由文本,数据元之间使用英文状态下的逗号分开短
名:charaDataEle
解:可选项;最大出现次数为1
7.2.8数据集发布日期(可选)
义:卫生信息数据集进行提交或发布的日期英文名称:datasetPublicationDateWS/T3052009
数据类型:日期型
取值规则:按照GB/T74082005规定,格式应当为YYYY-MM-DD短
名:dataPubDate
解:可选项;最大出现次数为1
7.2.9数据集分发格式(可选)
义:分发数据的格式说明
英文名称:DistributionFormat数据类型:复合型
名:DistFormat
子元素:分发格式一
分发格式名称十
0《版本)
解:可选项:最大出现次数为N
7.2.9.1分发格式名称
义:数据集分发格式名称
英文名称:formatName
数据类型:字符串
取值规则:自由文本,默认为文件扩展名称短
名:formName
解:必选项:最大出现次数为1
义:数据集分发格式所对应的软件版本(日期、版本号等)英文名称:formatVersion
数据类型:字符串
取值规则:白由文本
名:formVer
解:可选项;最大出现次数为1
7.2.10在线访问地址(可选)
义:可以对数据集进行在线访问或获取的信息英文名称:online
数据类型:字符型
取值规则:在线访间地址,按照RFC2396规定填写短
名:online
解:可选项:最大出现次数为N
数据集分类(可选)
义,数据集的分类信息
英文名称:DatasetCategory
数据类型:复合型
名:DataCat
子元素:数据集分类一
类目名称十
类目编码十
分类标准
解:可选项;最大出现次数为N
7.2.11.1类目名称
义:对应于所使用的某种分类方法所得到的具体类目名称英文名称:categoryName
数据类型:字符串
取值规则:自由文本
名:cateName
解:必选项;最大出现次数为1
类目编码
义:类别名称对应的编码
英文名称:categuryCode
数据类型:字符串
取值规则:自由文本
名:cateCode
解:必选项:最人出现次数为1
分类标准
义:所依据的分类标准名称
英文名称:categroyStandard
数据类型:字符申
取值规则:自由文本
名:cateStd
解:必选项;最大出现次数为1
相关环境说明(可选)
WS/T305—2009
义说明数据集生产的处理环境,包括软件、计算机操作系统、文件名和数据量等英文名称:environmentDescription数据类型:字符串
取值规则:自由文本
名:envirDese
解:可选项最大出现次数为1
元数据创建日期(必选)
义:创建,采集元数据的日期
英文名称:metadataDateStart
数据类型:日期型
取值规则:按照GB/T74082005规定,格式应当为YYYY-MM-DD短
名:mdDateStart
解:必选项:最大出现次数为1
7.2.14元数据标识符(必选)
义:元数据的唯一标识
英文名称:metadataldentifier数据类型:字符串
取值规则:在7.2.2的数据集标识符取值前加\MD\字样。短
名:mdID
解:必选项:最大出现次数为1;标识符须唯一、由字母【含下划线()短划线(-)点(.)斜线9
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。