首页 > 国家标准(GB) > GB/T 15387.2-2001 术语数据库开发指南
GB/T 15387.2-2001

基本信息

标准号: GB/T 15387.2-2001

中文名称:术语数据库开发指南

标准类别:国家标准(GB)

英文名称:Guidelines for the development of terminology database

标准状态:已作废

发布日期:2001-11-14

实施日期:2002-06-01

作废日期:2014-11-01

出版语种:简体中文

下载格式:.rar.pdf

下载大小:KB

标准分类号

标准ICS号:综合、术语学、标准化、文献>>01.020术语学(原则和协调配合)

中标分类号:综合>>基础标准>>A22术语、符号

关联标准

替代情况:GB/T 15387.2-1994

出版信息

出版社:中国标准出版社

书号:155066.1-18331

页数:平装16开, 页数:14, 字数:24千字

标准价格:12.0 元

出版日期:2004-04-09

相关单位信息

首发日期:1994-12-27

复审日期:2004-10-14

起草单位:中国标准研究中心

归口单位:全国术语标准化技术委员会

发布部门:中华人民共和国国家质量监督检验检疫总局

主管部门:国家标准化管理委员会

标准简介

本标准规定了术语数据库术语条目的结构、数据库的功能、扩充以及数据规范化的要求。本部分适用于术语库的研究、开发、维护及其管理工作。其他涉及术语数据处理的工作也可参照使用。 GB/T 15387.2-2001 术语数据库开发指南 GB/T15387.2-2001 标准下载解压密码:www.bzxz.net
本标准规定了术语数据库术语条目的结构、数据库的功能、扩充以及数据规范化的要求。本部分适用于术语库的研究、开发、维护及其管理工作。其他涉及术语数据处理的工作也可参照使用。


标准图片预览






标准内容

ICS_01.020
中华人民共和国国家标准
GB/T15387.2—2001
代替GB/T15387.2—1994
术语数据库开发指南
Guidelines for the development of terminology database2001-11-14发布
中华人民共和国
国家质量监督检验检疫总局
2002-06-01实施
GB/T15387.2-2001
规范性引用文件
术语和定义
术语条目结构
术语库的功能
数据规范化
其他要求
术语库的扩充
附录A(资料性附录)
A.1术语工作
A.2字符集
建立术语数据库有关的国家标准和国际标准A.3代码与数据元的表示·
A.4字符转写
A.5系统开发
A.6其他相关标准
GB/T15387分为两个部分:
第1部分:术语数据库开发文件编制指南;第2部分:术语数据库开发指南。言
本部分代替GB/T15387.2—1994《术语数据库开发指南》。本部分与GB/T15387.2—1994相比主要变化如下:修改了术语和定义一章中的一部分术语,并更新了所有术语的定义。第4章的标题改为“术语条目结构”;“字段的强制性”改为“字段的强制级别”(见4.7);术语库的功能一章中增加“网络支持”的要求(见5.10);附录A中增加了新制定的相关标准;GB/T15387.22001
根据GB/T1.1一2000《标准化工作导则第1部分:标准的结构和编写规则》的要求,对标准编排的格式进行了修改和调整。GB/T15837是术语数据库的系列国家标准之一。已经发布的配套标准有:GB/T13725—2001
GB/T13726—1992
GB/T15625—2001
GB/T16785—1997
GB/T16786—1997
GB/T17532-1998
建立术语数据库的一般原则与方法术语与辞书条目的记录交换用磁带格式术语数据库技术评价指南
术语工作概念与术语的协调
计算机应用
术语工作
数据类目
术语工作
计算机应用
GB/T18155—2000,术语工作
计算机应用
本部分的附录A为资料性附录。
本部分由全国术语标准化技术委员会提出。本部分由中国标准研究中心归口。本部分由中国标准研究中心负责起草。机器可读术语交换格式(MARTIF)协商交换本部分由全国术语标准化技术委员会负责解释。本部分主要起草人:叶盛、李明非,张志云、肖玉敬、卢丽丽、徐俊荣。1范围
术语数据库开发指南
GB/T15387.2—2001
本部分规定了术语数据库(简称“术语库”)术语条目的结构、数据库的功能、扩充以及数据规范化的要求。
本部分适用于术语库的研究、开发、维护及其管理工作。其他涉及术语数据处理的工作也可参照使用。
2规范性引用文件
下列文件中的条款通过本部分的引用而成为本部分的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本部分,然而,鼓励根据本部分达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本部分。GB/T3792.1文献著录总则(GB/T3792.1—1983)GB/T3860文献叙词标引规则(GB/T3860—1995)GB/T8566信息技术软件生存周期过程(GB/T8566--2001,ISO/EC12207:1995,IDT)GB/T13418文字条目通用排序规则(GB/T13418--1992.ISO7154:1983,NEQ)GB/T13725—2001建立术语数据库的一般原则与方法GB/T13726—1992术语与辞书条目和记录交换用磁带格式(ISO6156:1987.NEQ)GB/T13745学科分类与代码(GB/T13745—1992)GB/T15387.1—2001术语数据库开发文件编制指南GB/T15237.1—2000术语工作词汇第1部分:理论与应用GB/T16786—1997术语工作计算机应用数据类目(ISO/DIS12620—1996EQV)GB/T17532—1998术语工作计算机应用词汇(ISO/DIS1087-2-2:1996,EQV)3术语和定义
GB/T15237.1—2000.GB/T16786--1997、GB/T17532—1998确立的术语和定义适用于本部分。为了便于使用,本部分重复了其中的部分术语和定义。3.1
术语term
在特定专业领域中一般概念的词语指称。3.2
[GB/T15237.1—2000,3.4.3]
数据库database
长期储存在计算机中,有组织、可共享的数据集合。[GB/T17532—1998,7.5]
术语数据库terminologicaldatabase包含术语数据的数据库。
GB/T15387.2—2001
[GB/T17532—1998,7.6]
记录record
作为一个单位来对待的数据元的集合。[GB/T17532—1998.7.9]
数据元dataelement
在一定的上下文中具有区别特征的数据单元。[[GB/T17532—1998,7.11]
数据字段datafield
为特定的数据元而保存在一个记录中的变长或定长的部分。[GB/T17532—1998.7.12]
数据类目datacategory
数据元类型dataelementtype
关于给定数据字段的类型说明。[GB/T17532-1998,7.14]
标识符identifier
用于标识或命名一个数据类目的一个或多个字符。[GB/T17532—1998,7.15]
术语条目terminological entry术语数据集合中所包含的关于个概念的术语数据。[GB/T17532—1998.3.22]
4术语条目结构
在术语库中,根据不同的使用目的,每一条术语及其相关的一组数据元构成一个术语单位。每一数据元占用一个字段(或子字段),具有相同属性的一类数据元构成一个数据字段。4.1字段数目
应根据术语库应用的需求确定字段数目,既要按照规范化的要求,最大程度地满足用户需要,又要避免浪费。
4.2'字段名称
应使用易记、易识别的字符申。例1:
字段名称:序号(xuhao/number)缩写:xh(汉语拼音)或Num(英语)例2:
字段名称:定义(dingyi/definition)缩写:dy(汉语拼音)或def(英语缩写)4.3字段标识符
字段标识符可使用字母或数字,如果使用数字,应符合GB/T13726—1992附录A的要求。字段标2
识符及其编制原则与方法,应在提供给用户的文件中注明。4.4字段数据类型
4.4.1字符型
可以汉字、字母、数字、特殊符号等。术语、定义等应使用字符型字段。4.4.2数字型
可以是整数、小数、正数和负数等。序号应使用数字型字段。4.4.3日期型
日期型数据字段结构为:CCYYMMDD。例:20010515表示2001年5月15日。GB/T15387.2—2001
术语源的生成日期(例如标准发布日期,辞书出版日期等)术语记录的生成日期等应使用日期型字段。
4.4.4其他
术语数据还可能涉及其他字段数据类型,例如逻辑数据类型等。4.5字段长
术语库应尽可能使用变长字段,使用定长字段时应考虑使用方便及节约存储空间等因素。4.6字段间关系
根据术语数据元之间关系的特点,字段间的关系可以是一对一(1:1)、一对多(1:N)或多对多关系(M.N)。
4.7字段的强制级别
字段的强制级别应根据该术语库的工作目的而确定。4.7.1必选字段
当术语数据类目是构成术语条目所必需的最小信息时,使用此类字段。例如,面向概念的术语库中的“术语”“定义”,面向翻译的术语库中的“术语”“外文对应词”等。必选字段必须设立,不允许空缺。4.7.2应选字段
当术语数据类目是构成术语条目所必要的信息时,使用此类字段,但允许空缺。例如,面向翻译的术语库中的同义词、术语的缩略形式等。4.7.3可选字段
当术语数据类目是构成术语条目的可选信息时,使用此类字段。例如,语法信息、语境等。4.8字段的可重复性
当属于相同的术语数据类国的术语数据元(如同义词)需要在一个记录中出现几次时,可重复使用同一字段。
4.9字段的组合性
几乎所有术语数据类目的数据元(字段)均可以与一个或若干术语数据类目的数据元(字段)组合,构成一个新的术语条目。
4.10.子字段此内容来自标准下载网
当确定的某一字段可能存在几个值,或一个字段需反映几项内容时,可使用子字段。a)一条术语可能有若干个同义词,可根据使用状态进一步划分子字段,例如优先、许用、拒用。b)同义性(程度)字段需划分子字段,例如恒等于(三)、大于(>)、小于等于(<=)、交叉(X)、近义(~)、反义(一→)等。
4.11相互参照
不同记录之间(如一条术语参照另一条术语),不同的文件之间(如主文件与倒排文件);不同数据库之间(如图形数据库与文本数据库之间,不同语种数据库之间)均存在相互参照。3
GB/T15387.2—2001
5术语库的功能
5.1用户界面
应能提供良好的汉字处理环境和友好的用户界面。设计的屏幕应具备以下功能:
a)人机对话。
使用者通过键盘或其他输人设备向机器输人提问或其他有关信息,机器通过显示屏幕或其他输出设备给使用者提供解答、提示或其他有关信息。b)选单驱动。
应根据需要设置系统管理和用户查询使用的不同选单,应设计一个选单系统为用户显示多重选择,根据需要可设计多级选单。
例如:
一级选单:主功能选择。例如数据输人、数据维护与更新、数据检索、排序和打印等;二级选单:子功能选择,单项功能中的子项,条件等。例如数据检索功能中的浏览、设定检索式、显示检索结果等;
三级选单:需要设计的下一层细化功能选择。c)提示功能。
例如:
出错提示:指示错误的性质和类型,以至于如何改正;拒绝接收提示:指示、告警无效或错误的操作;操作步骤提示。
d)求助功能。
例如:
正确操作的具体、详细的说明;有关内容的资料,包括语种代码、学科代码、源机构代码、责任者代码等常用代码及其含义说明:有关屏幕显示内容的解释,参数值的含义与范围,命令或功能选择描述。求助功能可使用窗口技术或调用辅助库、辅助屏子以实现,此状态应易于进入和退出、返回原操作状态。
e)用户需要的其他功能。
例如;浏览、窗口等。
5.2数据检索
术语库除应能检索单一术语及相应信息(定义、外文对应词等)外,还应根据需要设计以下几种类型的检索。
a)内部属性检索。
根据分类语言、叙词语言进行检索。分类语言检索得出的是适合某一分类的某一领域内成体系的全部术语;叙词语言检索出的是某一术语可能涉及的所有术语,包括其他领域内的相关术语。b)外部属性检索。
例如:
按术语源书目编目数据检索出该文献所包含的所有术语;按源机构(或责任者)检索出该机构所编纂(制定)的所有术语按年代检索出术语编纂的年度变化情况。c)组合属性检索。
同属性或不同属性的组合检索。4
检索技术应满足GB/T13725-2001中8.2的各项要求。5.3查重与数据校验
GB/T15387.2—2001
应设计查重功能,数据校验功能应根据GB/T13725—2001中8.1.2的要求设计。5.4术语库重组与重构
a)根据需要,设计数据库重组功能,自动的回收已别除记录所占的存储空间,并重新加以利用。b)当需要时,可改变存取控制、硬件配置、数据库分布以及修改数据结构等。5.5恢复、备份和重新启动
应支持术语库的恢复、备份和重新启动。由于误操作、程序出错或其他意外原因(例如掉电)需要重新启动时,使用备份;
由于人为或意外原因造成术语库的破坏时,应能:a)查明错误的原因;
b)查明错误的影响;
c)纠正错误;
d)纠正后继续工作。
5.6定义默认值
应按照GB/T13725—2001中8.1.3的要求,根据需要定义歇认值,便于字段内容的自动或半自动生成与修改。
5.7数值处理
应根据需要设计数值处理功能,例如术语和定义的平均长度,某一长度的术语数量及百分比,年术语生成量、使用量、某一用户使用术语库的情况,某一机构编术语的情况等。5.8排序和打印
字顺排序应符合GB/T13418的规定。根据需要设计排序和打印功能以满足下列要求。a)应能生成和打印按概念体系排序的术语词汇或词典;b)应能生成和打印按外文字母顺序或汉语拼音排序的英一汉、汉一英对照词汇或词典,或其他外语与汉语对照词汇或词典;
c)应能生成和打印同义(近义)词汇或词典;d)应能生成和打印反义词汇或词典;e)如果需要,还应能生成语料的有关信息,例如按术语使用频率排序、按术语与其他术语组配频率排序等。
f)其他功能。
5.9程序设计语言接口
应能提供某种常用程序设计语言的接口,允许使用该程序设计语言编写自已的应用程序,开发某些特殊功能。
5.10网络支持
应能实现网络查询、数据搜索和数据下载等网络应用的基本功能。5.11其他
a)数据输人应符合GB/T13725—2001中8.1的要求;b)数据显示应符合GB/T13725—2001中8.3的要求;c)数据安全性和保密应符合GB/T13725—2001中6.1.7和8.6的要求;d)数据传递和数据交换应符合GB/T13725—2001中7.7和第10章的要求。5
GB/T15387.2-2001
6数据规范化
6.1数据采集
应从需要和可能两个方面,并根据GB/T13725--2001中7.2.1确定数据采集的要求。6.1.1数据需求
&)拟收录术语的范围及总数量(可分期安排);b)拟使用的语种及使用程度(是仅收录相应语种的外文对应词,还是也收录该术语的定义、同义词等其他数据);
c)拟确定的数据类目。
6.1.2数据保障
a)术语源的类型,例如标准、百科全书、词典、专业文献等:b)术语源的权威性、充足性,例如,多语种的术语库就需要有多语种的文献;c)专家构成,包括专业领域的专家、术语学家、语言学家等,d)工作人员水平,包括专业水平、外语水平等;e)应根据GB/T15387.1—2001中5.14~5.16的要求编写数据加工技术规则;f)应根据GB/T15387.1—2001中5.18的要求编写数据加工工作规程;g)应规定数据验收标准和验收方式,包括对各项数据和各加工过程和质量要求、检验方法、依据和程序等。
6.1.3数据的采集方法
根据6.1.1~6.1.2条确定数据采集原则以后,规定数据采集的统一格式(采集卡片或工作单),根据该统一格式收集、挑选、登录数据。该格式应满足术语库对数据的要求,应与术语库结构一致。6.2标引
6.2.1分类法
为了便于标引工作和国内外术语数据的交换,应尽量采用通用的分类法。例如:
a)中国标准文献分类法(CCS);b)国际标准分类法(ICS):
c)GB/T13745学科分类与代码。6.2.2叙词表
为了表示某一概念所属的学科领域或主题特性,可使用叙词检索语言。例如:
a)汉语主题词表及与其兼容的有关专业性主题词表;b)标准文献主题词表(ROOTTHESAURUS)。6.2.3分类标引和叙词标引
a)对于通用、基础性术语或选自综合性文献的术语应根据该术语的分类和定义的主题特性进行标引。
b)某些术语条目的分类标引和叙词标引也可以采取与术语源一致的方法。某一术语条目取自某一术语标准,则该条目的分类标引和叙词标引与该标准一致。c)多重标引。
某一概念属于若干个专业领域时,或术语库需要同时使用多种分类法和叙词表时,需重复标引。6.2.4标引规则与标引内容
应遵照GB/T3860的规定,分类标引的内容包括分类法的源码,该术语(或术语源)所属专业领域的分类代码及专业领域名称。
例1:GB/T13745(源码)520.4050(分类代码)XX×数据库(专业领域名称)。例2:UDC(源码)681.3.01(分类代码)X××数据处理原理(专业领域名称)。叙词标引的内容包括叙词表的源码、叙词代码及叙词。例:ISO-ROOT(源码)MJG.JM(叙词代码)XX×数据库(叙词)GB/T15387.2—2001
应向用户提供所使用的分类法和叙词表以及标引规则说明,必要时,还应提供不同分类法和叙词表的对照(或转换说明。
6.3代码
术语库中所使用的代码,例如:语种代码、学科代码、源码、责任者机构代码等应符合相应的国家标准,如无国家标准可参照时,可自行定义,但必须在向用户提供的技术文件中详细说明。必要时,应建立辅助的代码数据库,供用户随时查询。6.4著录
应规定统一的著录项目、规则和格式以及缩写著录细则。术语条目著录应符合GB/T3792.1及相关国家标准的规定。7其他要求
a)建库过程与工作步骤应符合GB/T13725—2001第7章的要求。b)术语库计算机系统应符合GB/T13725--2001中6.2的要求。c)术语库有关的软件开发,应避照GB/T8566的各项规定。d)术语库开发过程中需编制有关技术文件,文件内容及编写要求应遵照GB/T15387.1的各项规定。
e)少数民族语言文字的术语库应尽可能利用拉丁文转写,以便于使用新引人的术语库软件。8术语库的扩充
下述情况可能需要扩充术语库:a)增加新的专业领域;
b)增加新语种:
c)增加新的数据类目;
d)增加新条目;
e)增加新的数据类型(如图、公式、特殊符号等);f)增加新功能:
g)改变软、硬件配置,变换机型;h)数据传递,数据转换等。
GB/T15387.2—2001
A1术语工作
A.1.1国家标准
GB/T3860
附录A
(资料性附录)
建立术语数据库有关的国家标准和国际标准文献叙词标引规则
GB/T3792.1
GB/T 4880.2
GB/T10112
GB/T13190
GB/T13418
GB/T13715
GB/T13725
GB/T13726
文献著录总则
第2部分:3字母代码
语种名称代码
术语工作原则与方法
汉语叙词表编写规则
文字条目通用排序规则
信息处理用现代汉语分词规范
建立术语数据库的一般原则与方法术语与辞书条目的记录交换用磁带格式GB/T15237.1术语工作词汇第1部分:理论与应用GB/T 15238.1
辞书编繁基本术语
GB/T15387.1术语数据库开发文件编制指南GB/T15417文献工作多语种叙词表编制规则GB/T15625
GB/T15933
GB/T16617
GB/T16785
GB/T16786
GB/T17532
GB/T18155
术语数据库技术评价指南
辞书编篆常用汉语缩略语
辞书编繁符号
术语工作概念与术语的协调
计算机应用
术语工作
数据类目
术语工作计算机应用
术语工作计算机应用机器可读术语交换格式(MARTIF)协商交换GB/T20001.1标准编写规则第1部分:术语A.1.2国际标准
JSO12620
ISO12200
计算机辅助术语工作一术语交换格式(TIF)一数据元词典计算机辅助术语工作术语交换格式(TIF)一SGML(标准通用置标语言)的应用ISO/DTR12618计算机辅助术语工作一术语数据库和文本数据库的建立和使用ISO10241
ISO/R860
ISO/R1149
国际术语标准的制定与编排
概念和术语的国际协调
多语种分类词汇的编排
文献工作单语种叙词表编制规则ISO2788
ISO/R919
分类词汇表编制规则
A.2字符集
A.2.1国家标准
GB/T1988
信息处理
GB/T2311
信息处理
信息交换用七位编码字符集
七位和八位编码字符集代码扩充技术GB/T11383信息处理信息交换用八位代码结构和编制规则GB/T8565信息处理文本通信用编码字符集GB2312信息交换用汉字编码字符集基本集GB/T7589
信息交换用汉字编码字符集第二辅助集GB/T7590
信息交换用汉字编码字符集第四辅助集GB/T12345
GB/T13131
GB/T13132
GB13000.1
GB/T6513
GB8045
GB12050
信息交换用汉字编码字符集
辅助集
信息交换用汉字编码字符集
第三辅助集
信息交换用汉字编码字符集
第五辅助集
信息技术通用多八位编码字符集(UCS)文献书目信息交换用数学字符编码字符集信息处理信息交换用蒙古文七位和八位编码图形字符集信息处理信息交换用维吾尔文编码图形字符集GB12052
GB13134
信息交换用朝鲜文字编码字符集信息交换用葬文编码字符集
GB/T13141
书目信息交换用希腊字母编码字符集2书目信息交换用拉丁字母代码字符扩充集GB/T13142
A.2.2国际标准
ISO5427书目信息交换用基里尔字母扩展字符集ISO6438
3文献工作书目信息交换用非洲字母编码字符集信息处理八位单字节编码图形字符集ISO8859
ISO/DIS6861基里尔字母编码字符集ISO6630文献工作书目控制字符集ISO/DP8957.2希伯莱字母编码字符集A.3代码与数据元的表示
A.3.1国家标准
GB/T2659
世界各国和地区名称代码
中国各民族名称的罗马字母拼写法和代码GB/T3304
GB/T3469
GB/T4880
GB/T4881
GB/T7408
GB/T7156
文献类型与文献载体代码
语种名称代码
中国语种代码
数据元和交换方式
文献保密等级代码
GB/T13745
学科分类代码
A.3.2国际标准
信息交换
日期和时间表示法
ISO/DIS6093信息交换用字符串中的数值表示法ISO6523数据交换机构标示法的结构ISO7064信息处理校验码系统
ISO/DP7352数据交换用数据元的组织结构及其表示法的导则ISO/DIS7826用于交换的代码表示法的一般结构A.4字符转写
A.4.1国际标准
GB/T15387.2—2001
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。