首页 > 国家标准(GB) > GB/T 13725-2001 建立术语数据库的一般原则与方法
GB/T 13725-2001

基本信息

标准号: GB/T 13725-2001

中文名称:建立术语数据库的一般原则与方法

标准类别:国家标准(GB)

英文名称:General principles and methods for establishing terminology database

英文名称:General principles and methods for establishing terminology database

标准状态:已作废

发布日期:1992-10-06

实施日期:2002-06-01

作废日期:2020-03-01

出版语种:简体中文

下载格式:.rar.pdf

下载大小:KB

标准分类号

标准ICS号:综合、术语学、标准化、文献>>01.020术语学(原则和协调配合)

中标分类号:综合>>基础标准>>A22术语、符号

关联标准

替代情况:GB/T 13725-1992

出版信息

出版社:中国标准出版社

书号:155066.1-18328

页数:平装16开, 页数:17, 字数:30千字

标准价格:13.0 元

出版日期:2004-04-10

相关单位信息

首发日期:1992-10-06

复审日期:2004-10-14

起草单位:中国标准化与信息分类编码所

归口单位:全国术语标准化技术委员会

发布部门:中华人民共和国国家质量监督检验检疫总局

主管部门:国家标准化管理委员会

标准简介

本标准规定了建立术语数据库的一般原则与方法。本标准适用于术语库的研究、开发、维护及有关管理工作。在其他涉及术语数据处理的工作中也可参照使用。 GB/T 13725-2001 建立术语数据库的一般原则与方法 GB/T13725-2001 标准下载解压密码:www.bzxz.net
本标准规定了建立术语数据库的一般原则与方法。本标准适用于术语库的研究、开发、维护及有关管理工作。在其他涉及术语数据处理的工作中也可参照使用。


标准图片预览






标准内容

ICS.01.020
中华人民共和国国家标准
GB/T 137252001
代替GB/T137251992
建立术语数据库的一般原则与方法General principles and methods forestablishing terminology database2001-11-14发布
2002-06-01实施
中华人民共和国
国家质量监督检验检疫总局
规范性引用文件
术语和定义
术语库的建设
术语库的类型和信息流程
6术语库系统的基本要求
建立术语库的基本过程
8术语库的生成和使用
9术语库系统的管理与维护
10术语库间信息资源共享
附录 A(规范性附录)术语库的实体:-关系图次
GB/T 13725--2001
本标准代替GB/T13725-1992《建立术语数据库的一般原则与方法》。GB/T13725—2001
本标准对G13/T137251992《建立术语数据库的一般原则与方法》有如下修改:在规范性引用文件中增加了:
a)GB/T15237.1—2000术语工作词汇第1部分:理论与应用
GL/T16786—1997术语上作计算机应用数据类目b)
GB/I17532—1998术语上作计算机应用词汇
机器可读术语交换格式(MARTIF)协商GB/T 18155—2000
术语工作计算机应用
增加了术语和定义一章;
把第5章输人、输出设备中的过时设备改为目前应用的设备;在第5章中增加了规范化处理;
修改了6,1.8条的内容;
在 G.2. ]1中增加了图像,声音等多媒体信息;在6.2.2中增加了具有高可靠性和具有联网功能两项内容;在6.3.2.1中修改语法信息为词类和其他语法信息\---修改了表;
-在7.5.2.2中增加了审查用户报告和审查查新报告两项内容:增加『网络,多媒体技术方面的内容;修改了文字使用不恰当的地方,修收和调整了GB/T13725—1992标准的编排格式.符合GB/T1.12000《标准化工作导则第1部分:标准的结构和编写规则》的要求。本标准是术语数据库的系列国家标准之一。已经发布的系列标准有:-GB/T13726-1992术语与辞书条日的记录交换用磁带格式GB/T15387.1—2001术语数据库开发文件编制指南-GB/T15387.2:2001术语数据库开发指南-GB/T15625—2001术语数据库技术评价指南-GB/T16785---1997术语工作概念与术语的协调GBT16786—1997术语上作计算机应用数据类目GB/17532—1998术语工作计算机应用词汇GB/T18155一2000术语工作计算机应用机器可读术语交换格式(MARTIF)协商交换本标准的附录 A 为现范性附录,本标准山全国术语标准化技术委员会提出。本标准山中国标准研究中心归口,本标准起草单位:中函标准研究中心,国家邮政局科学研究规划院。本标准由全国术语标准化技术委员会负责解释,本标雅主要起草人,本明非、叶盛、张志云、肖玉敬、卢丽丽、徐俊荣。本标准所代替标准的历次版本发布情况为:GB/T 13725--1992
1范围
建立术语数据库的一般原则与方法本标推规定了建立术语数据库(简称“术语库”)的一般源则与方法。GB/T 137252001
本标准适用于术语库的研究、开发、维护及有关管理工作。在其他涉及术语数据处理的工作中也可参照使用,
2规范性引用文件
下列文件中的条款通过本标准的引用面成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括助误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用丁本标准。GB4943信息技术设备(包括电气事务设备)的安全(GB4943—1995,IEC950:1991,IDT)GB/T10112术语工作原则与方法(GB/T10112:1999,1SO704:1997,NEQ)GB/T15237.1—2000术语工作词汇第1部分:理论与应用(ISO1087-1:2000,FQV)GB/T16786—1997术语工作计算机应用数据类目(ISO/DIS12620:1996,EQV)GB/117532—1998术语工作计算机应用词汇(ISO/D1S1087-2-2:1996EQV)GB/T18155术语工作计算机应用机器可读术语交换格式(MARTIF)协商交换(GB/T 18155---2000,1SO 12200:1999,EQV)GB/T20001.12001标准编写规则第1部分:术语(IS01024l:1992Internationalterminolo-gy standards-Preparation and layout ,NEQ)3术语和定义
GB/T15237.1—2000GB/T16786—1997、GB/T17532—1998确立的术语和定义适用丁本标准。为了便于使用,本标准重复了其中的部分术语利定义。3.1
术语 term
在特定专业领域中-般概念的词语指称。[GB/T 15237.1—2000.3. 4. 3]3.2
术语数据库terminologicaldatabase存储术语数据的数据库。
注,改自 GB/T 17532—1998,7.6.3.3
数据元data element
在一定的上下文中具有区别特征的数据单元。[GB/T 175321998,7.11]
数据字段datafield
GB/T 13725—2001
为特定的数据元而保存在·-个记录中的变长或定长的部分。[GB/T 17532—1998,7.12]
数据类目data category
数据元类型dataelemcnttype
关于给定数据字段的类型说明。[GB/T 17532--1998,7-14]
术语条目 terminological entry术语数据集合中所包含的关于一个概念的术数据。_GB/T 17532—1998,3.22]
4术语库的建设
4.1术语库可分成三级:
a)国家标准化术语库;
b)专业领域术语库;
c)基层术语库。
4.1.1国家标准化术语库具有臀理我国标准化术语的功能。4.1.2专业领域术语库应明确专业分工,界定范,摘好协调工作,避免重复、遗漏和浪费,4.1.3有关单位可根据工作需要建立基层术语库。4.2术语库的建设应遵循国家有关信息系统建设的规定,做好与其他术语库的协调,实现信息交换与资源共亨享。
5术语库的类型和信惠流程
5.1术语库的类型
5.1.1面向概念的术语库
突出概念体系的合理性与层次性,并包括概念的严格定义,几定义具有权威性的术语库。5.1.2面向翻译的米语库
根据需要包含两种或两种以上语言的术语对应词,含有较多的语言学信息(如词性,语境、用例等)的术语库。
5.1.3面向特定目标的术语库
作为专家系统、知识库系统、机器翻译系统等的组成部分,为满足各种特定目标要求而建立的术语库。
5.1.4其他特殊用途的术语库
根据实际需要进行设计的术语库,如用词库等。5. 2术语库系统信息流程
术语库系统信息流程如图1所示。5.2.1术语信惠源
术语信息可以来自国家标准、行业标准及其他标准义献,也可以来自权威性的辞典、百科全书及其他工具书和文献;或者是由专家、学者及用门提供的对新概念的定义和指称,还可以通过与其他术语库联网.交换术语数据及记录载体等方式获得。5.2.2规范化处理
按照已定的标准式或规则,对从各种途径获取的术语信息进行加工。2
5.2.3输入
术语息源
规范化
术语晖
其他术语库
图1术语系统信惠流程图
GB/T 13725—-2001
原始术语信息经规范化处理后,通过输入设备,例如键盘,文字识别设备、语音识别设备等,输入到术语库系统。
5.2.4术语库系统
术语库系统对输人信息(数据)进行处理后,存人存储器,可以方便地存取、检索、修收、删除、更新利补充数据。
用户通过输出设备,例如屏幕显示器、打印机、软盘驱动器、光盘驱动器,语音设备、缩微胶片设备、照排设备等使用术语库中的信息。5: 2. 6用户
术语库的用户包括:标谁的制修订者、翻译工作者、辞书编人员、编辑人员,教育工作者、语音学工作者,科技工作者、学生以及其他用户。5. 2.7信息共享
通过联网、交换数据记录载体等方式实现与其他术语库系统信息资源共享。6 术语库系统的基本要求
6. 1设计原则与质量要求
6.1.1目的性
应对各方面的用户需求进行调查分析,并依据大多数用户对术语库功能、性能,数据等方面的要求,在充分考虑社会效益和经济效益的前提下开发术语库。术语库的开发应符合实际使用的需要。6. 1.2 科学性
应对术语库开发中涉及到的各种学科的理论与技术进行充分的研究,运用系统工程的方法在科学的基础上开发术语库。
6. 1. 3 易用性
系统应简单易学,使用方便。
6. 1.4经济性
应选择技术上先进,经济上合理的设计方案。6. 1.5可靠性
硬件配置、软件的选择利开发保证术语库具有高可靠性。6.1.6易维护性
a)为使系统保持良好工作状态和防止事故于未然而进行的预防性维护;3
GB/T 13725—2001
b)为克服故障而进行的纠错性维护;c)为使软件产品能够在改动的坏境下继续使用而进行的适应性维护;d)为改善性能而进行的完善性维护等。6.1.7安全性
a)应按GB4943的要求进行系统的硬件设计和安装;b)应制定保证术语库系统设备安全的分级管理守则;c)应对各类用户在不同条件下对各种范围内的数据的存取权限作出规定:d)应能防止数据交换过程巾可能出现的计算机病毒侵入,并具备检查和清除病毒的有效措施:e)应根据需要对特殊数据的保密提供保护机制和保密措施。6. 1. 8易扩缩性
应能根据需求的变化,易扩充或缩减系统功能。6.2对计算机系统的要求
6.2.1基本要求
6.2.1.1术语库计算机系统应有较强的文字处理能力,能支持汉字信息处理。根据需要能支持多种语言、文字、符号、公式、图形、图像、声音等多媒体信息等。6.2.1.2大型术语库系统应能过互联网与同内其他大型术语库及世界上主要术语库实现信息资源共享,
对硬件的基本要求
a)根据系统设计要求优选适用的算机;b)能较容易地实现主机与外设的配套:c)有足够的内存和外存空间;
d)数据处理速度、系统输人输出能力应满足业务类型和用户数虽等的要:e)系统应兼容性好,维修方便:f)系统具有安全性和高可靠性;g)具有联网功能;
h)具有较强的可扩充能力,能方便地实现现场升级。6.2.3对软件的基本要求
a)应完整、配套.形成系统。包括系统软件、汉字支持软件、数据库管理软件、通信控制软件、网络管理系统,安全保密及其他应用软件:b)应具有较好的灵活性和可移植性,对运行坏境有较强的适应能力;c)具有较强的可扩充能力,能够根据需要升级!d)有较好的人机交互能力;
e)数据库管理系统功能强,能方便地进行数据存取,检素、补充、修改和谢除等:()具有较好的安全性和保缔性
g)应使用国家标准和有关国际标准所规定的字符集。应尽可能使字符集可扩充,使特殊字符可直接访间,并根据需要考虑多语种的兼容处理问题。6.2.4对通信系统的要求
根据需要,可支持实现先进的计算机网络通信,支持开放系统互联,能实现通过网络的数据库存取。6.3对术语数据的要求
6.3.1基本要求
6.3. 1.1正确性
人库术语数据应是经核查正确无误、有效的。6. 3. 1. 2 —致性
应排除由于术语数据来源不同而产生的不一致。6. 3. 1. 3完整性
应保证术语数据元、数据类目和数据结构的完整,6.3.1.4独立性
数据应独立于计算机系统,且独立于存储方法和存取方式。6. 3.1.5适时性
及时更新术语数据。
6. 3. 2 数据类目的选择
数据类目应首先从以下五类中选择,6.3.2.1描述术语的数据
主要包括:
[汉语]主条目术语;
一简称(缩略语);
一全称(当主条日术语为简称时);一同义词;
其他语种对应词;
一符号;
词类,
其他语法信息;
注音;
术语的注释:
参见。
6.3.2.2描述概念的数据
土要包括:
概念的定义;
一概念的描述;
语境:
示例、公式、表格.图形等。
6.3.2.3描述概念体系的数据
主要包括:
分类(分类法);
叙词(叙间表)
一上位词;
一广义词(如果上位词不清楚):下位词;
获义词(如果下位词不清楚);
伺位词。
6.3.2.4用于管理的数据
主要包括:
记录标识;
语种代码;
文献来源代码;
记录的生成日期;
GB/T 137252001
GB/T 13725. - 2001
数据修订日期;
责任者代码;
使用的地域限定,
标准化或非标准化;
现行用法或过时用法;
优先或许用或拒用或被取代;
行业用语(行业范围);
机构内部的用语;
可带性代码,
6.3.2.5表示文献的数据
主要包括:
文献的类型(如标准、辞典、百科全书、手册等);文献信息·
,著(作、编)者:
·题目:
出版日期;
·出版机构:
·出版物的卷期号:
.标推号;
*术语信息在文献中的页码。
6.3.2.6其他数据项
应考虑到不同类型的术语库要求不同的数据类目,不同的用户群(如学生、翻译、学科领域的专家)需要不同类型的信息。一个多功能的术语库应具备灵活性,允许增加新的数据类日。6.3.3数据结构
在进行数据分析时,应建立起数据结构模型。6.3.3.1术语数据元之间的关系
术语数据儿可以是面向概念的,可重复的或不可重复的。它们可以由其他数据元组合而成。术语库中词条的数据元可以是与概念相关的信息(如定义、描述等),也可以是与术语相关的信息(如语法信息、语境等),如图2所示。学科(专业)频城
源资料
间义词
源资料
源资料
术语(其他语种对应词)
语法潮资料
与概念有关的和与术语有关的信图2
6.3.3.2术语的多语种对应关系
同概念的术语在不同的语种中的对应关系有以下三种类型:6
GB/T13725-2001
8)完全对应
概念体系是在两个语种中独立地建立起来的,术语所表达概念的定义以及概念在概念体系中的位暨在两个种中完全相同,
b)不完全对应
当概念在两个语种中不能完全对成,但其差别能用两个概念的若干术语相五翻译时,则应将这些术语并列在该词条下,并加注解指出差别和相似性,c)完全无对应
当一个概念在另-一语种中无对应时,可以翻译定名(或空缺),位应在术语库中特别标记。6.3.3.3数据结构的描述
可使用实体一关系图(E一R图)描述数据结构。见谢录A。术语库实体一关系图应将每个数据元独立地分开,并描述术语库中不间数据元之间的逻辑联系。6. 3.3.4数据结构的修改
增加一个字段;
一增加一个层次结构;
-改变字段的顺序,
一细分和(或)合并字段:
改变字段名:
改变字段的数据类型;
其他修改,
6.4对术语信息源的要求
6.4.1科学性
人库概念、定义和术语应符合GB/T10112的各项规定,6.4.2权威性
术应从具有权威性的文献中选择并经有关专家审定。6.4.3系统性
术语的选择和收录应系统地进行,并保证概念体系的完整性。6.4.4一致性
审核人库术语时,应避免一个专业领域内的一个概念用多个术语表达,或一个术语指称多个概念,尤其要避免同一概念的定义不一致。6.5术语库的服务方式
服务方式应方便用户使用,建库时可根据需要如以选择。例如:查询;
屏幕显示;
打印;
磁盘、光盘录制;
-排版;
缩徽,
联机检索;
一通过互联网下载;此内容来自标准下载网
一其他可用的数据交换方式。
7建立术语库的基本过程
7.1术语库开发的基本过程及需备文件GR/T13725—2001
术语库开发的基本过程及需备文件见表1:表1术语库开发的基本过程及需备文件初始期
规划论证
项日中请书
用户需求报告
可行性研究报告
系统开发作务书
需求分析
开发期
系统设计
系统实施
数据要求说明书概念模式设计说技术报告审查与验收
测域分析报告
逻辑模式设计说程序编制说明书“用户报告
功能要求说明书
物理模式设计说数据录入规则
录人工作单
硬件要求说明书
软件要求说明书
工作计及任务分配书
设计审查报告
测试计则书
系统设计详细计划及工作流程图审套报告
验收报告
查新报告
运行期
系统运行
操作手册
使用于册
维护手册
数据字典
(运行)管理守则
完整的系统并发文件档案及项异工作总结报告注,表1描述的工作过程和文件对于建立一个高质量的大型术语库是必要的,可根据系统开发的规模和具体需要进行选推。
7.2规划论证阶段
7.2.1先期准备
在对用户需求进行广泛和重点的调查、分析基础上,从需要和现实可能两个方面提出项口申请书,用户需求报告、可行性研究报告,山相关部门批准后,形成任务书(合同书、协议书),组成项目工作组(机构).正式开始该系统开发工作。7.2. 2制定工作计划及任务分配书项目确定后、应首先制定一个详细的工作计划,编制工作计划书,包括:该项日进展的各阶段月录;
各阶段工作安排及完成日期;
工作分工等,
7.3需求分析阶段
需求分析应详细、具体,并形成必要的工作文件7.3.1详细地调查研究术语数据需求,收集,挑选和登录原始资料.确定收录术语的范围(可按阶段安排),明确对数据类日和数据结构的要求、数据处理的要求、输人输出的要求等。完成数据要求说明书和功能要求说明书。
7.3.2根据数据需求分析,提出对系统功能、性能的要求,包挤硬件要求、软件要求、质量要求等,明确待开发系统的目标,分析现有条件,提出待购置或开发软、硬件纲目表,并提出对原有系统进行改造与扩充的建议方案.完成软、硬件要求说明书,7.4系统设计阶段
7.4.1概念模式设计
建立术语库的实体关系图,并编制概念模式设计说明。7.4.2逻辑模式设计
根据实体一关系图和所使用的数据库管现系统的类型,确定数据库的逻辑模式,并编写逻辑模式计说明书。
7.4.3物理模式设计
GB/T13725—2001
根据数据库管理系统所提供的功能,将逻辑模式映射到系统实现上,并编写物理模式设计说明书7.5系统实施阶段
7. 5. 1 程序编制
根据术语库系统的要求完战程序编制工作,并编写程序综制说明书。7.5.2数据加工
根据确定的数据类月和数据结构编制录入规则,设计录人工作单,选择、分析,整理、审定人库的术语、定义、描述,示例等。根据需要和可能选择外文对应,必要时,应先在汉语利选用的其他语和十建立概念对应关系,完成数据规范化预处理。7.5.3系统调试
对硬、软件进行安装与调试,对系统的功能、性能、质量等进行检验,对存在的问题作出改进设计,完善系统后建立模拟库,并试运行。7.5.4数据录入
对拟人库术语信息进行规范化处理后,完成大规模数据录人。7.6审查与验收
审查与验收应当有计划、有组织地进行。7.6. 1审查
审查应贯穿于术语库建设全过程的各个阶段,伴随着各个工作步骤进行。7. 6. 1. 1 审查人员
审查人员构成应考虑以下因素:a)与术语库相关的术语学、标谁化、计算机、语言学等方面的专家:b)用户。
7. 6. 1. 2 审查方式
a)文作审查:
b)会议审查;
c)系统測试。
7.6. 1. 3 审查内容
应按第6章的各项要求及其他有关国家标推,审查7.1-~7.4相应的工作项目。7. 6.1.4审奎报告
审查结果应有书面记录,包括,a)审查时间:
b)审奔方式:
c)审查内容;
d)审查人员:
c)审查结论性意处等。
应对审查中发现的问题提出或责成有关人员提出处理意见,必要时,进行设计改进或来取相应措施后再茨串查,或指派专人进行追踪审查,7.6.2验收
术语库建成后,设计开发单位应提出验收申请报告,由相关单位组织验收7.6.2.1正式的验收应公开进行。主要组织者和负责人由相关部门委派,但不应是该库研制开发的直接参与者。
7.6.2.2正式验收应召开验收会议,并至少履行下列程序:9
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。