GB/T 19708-2005
标准分类号
标准ICS号:综合、术语学、标准化、文献>>01.020术语学(原则和协调配合)
中标分类号:综合>>基础标准>>A22术语、符号
关联标准
采标情况:ISO 12199:2000,IDT
出版信息
出版社:中国标准出版社
书号:155066.1-23355
页数:16开, 页数:69, 字数:132千字
标准价格:28.0 元
计划单号:20020416-T-424
出版日期:2005-10-01
相关单位信息
首发日期:2005-03-28
复审日期:2023-12-28
起草人:于欣丽、叶盛、陈玉忠、张志云、程永红、徐俊荣、肖玉敬、宋敏、卢丽丽
起草单位:中国标准化研究院
归口单位:全国术语标准化技术委员会
提出单位:全国术语标准化技术委员会
发布部门:中华人民共和国国家质量监督检验检疫总局 中国国家标准化管理委员会
主管部门:国家标准化管理委员会
标准简介
了用拉丁字母表示的多语种术语和辞书资料(术语、术语成分或单词)按字母排序的规则。本标准已经考虑到了已有的术语和辞书资料记录中用拉丁字母表示的各种语言的字符集,同时还考虑到将其他语种的资料按国际规范的约定转写成拉丁字母时所使用的字符集。本标准给出的字母字符规则只适用于同时使用多语种的场合,并不影响各语种本身的字母排序。 GB/T 19708-2005 用拉丁字母系统表示的多语种术语和辞书资料字母排序规则 GB/T19708-2005 标准下载解压密码:www.bzxz.net
了用拉丁字母表示的多语种术语和辞书资料(术语、术语成分或单词)按字母排序的规则。本标准已经考虑到了已有的术语和辞书资料记录中用拉丁字母表示的各种语言的字符集,同时还考虑到将其他语种的资料按国际规范的约定转写成拉丁字母时所使用的字符集。本标准给出的字母字符规则只适用于同时使用多语种的场合,并不影响各语种本身的字母排序。
标准内容
ICS 01. 020
中华人民共利国国家标准
GB/T 19708—2005/ISO 12199:2000用拉丁字母系统表示的多语种术语和辞书资料字母排序规则
Aiphabetical ordering of nultilingual terminological and lexicographical datarepresented in the Lalin alphabet(IS012199:2000.IDT)
2005-03-23发布
中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会
2005-10-01实施
GB/T 19708—2005/IS0 12199:2000本标准等同采用ISO12199:2000用拉丁字母系统表示的多语种术语和辞书资料字母排序规”英文版)。
本标准的附录 A,附录 G 为规范性附录,附录 B,附录 C、附录 L)、附录 E和附录 F 为资料性附录。本标准由全国术语标准化技术委员会提出。本标由全国术语标准化技术委员会归口。本标雅出中国标准化研究院起革。本标准主要起草人:于欣丽,叶盛、陈玉忠、张志云、程永红、徐俊荣、肖下、宋敏,卢丽丽。GB/T19708—2005/IS012199:2000引
在操写术语集和辞书资料的工作(包括打印格式和数据库形或)中,为了便于用户的检索,有必要遵循国际公认的用手术语和辞书资料的拉丁字母排序规则。同时,这种规则也有利于术语和辞书资料的交换,因此采用国际标准规定的拉于字母排序规删是非常必要的。1范围
GB/T 19708---2005/ISO 12199.2000用拉学母系统轰示的多语种术语和辞书资料字母排厚规则
本标推规定了用拉丁母表示的多语种术语和辞书资料(术语、术语成分或单词)按字母排序的舰则。本标推已经考虑到了已有的术语和辞书资料记录中用拉宁舟表示的各种语言的字符集,同时还考虑到将其他语种的资料按国际规范的约定转写成拉丁字母时所使用的字符集。本标摊给出的学母字符规测只适用手同时使用多语种的场合,并不影响各语种本身的字存排序。本标准的面文规定了对字符串迎行逐字母排序的方法。本标准的附录A给出了逐调排序的规则,逐词排序月前已被广泛使用。本标雅的谢录B介绍了两条补充的规则,有助于辞书利术语的排序。本标推的附录C介绍了化学名称的排序规则。本标准的闭录D列出了拉丁宁母系统的各种符,本标摊的附录E列出了使用拉于字母系统的语种。本标摊的附录F给出了…些使用拉丁字母系统的谱种偏离本标谁规定的字舟顺序。本标准的附录G对本标准的正.文进行了规范性的说明,规则符合【SC)/IFC14651。2规范性引用文件
下列文件中的条款通过本标推的引用而成为本标准的条欲。凡是注口期的引用文件,其随后所有的修改单(不包括脚误的内容)或修订版均不适用于本标推,然而,鼓励根据本标准达成协议的备方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件其最新版本适用于本标准。GB/T4880—1091语称名称代码(e11SO 639:1988)GB/T4880.2—2000语种名称代码第2部分:3字母代码(eVIS0639-2:1998)GB13000.1信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平而(GB 13000. 11993.idt IS0/IEC 10646. 11993)GB/T15237.1---2000术语工作词汇第1部分理轮#席用(evIS01087-12000)GB/T 175321998术讲T作计算机应用间汇(eqVI50/DIS 1087-2-2:1996)ISO/IFC:14651信息技术国际字符串排序约定字符串的比较方法和按需裁减的排序方法3术语和定义
GB/T15237.1—2000和GB/T17532一1998确的以及下列术证秤定义适用于本标准。3. 1
字符character
供组织、控制或表示数据用的元素集合中的“个元素。3.2
字母letter
图形学符,单独或同别的学母红合便用,求要用于代表会活造言中的一个发声单元3.3
数字digit
用于表示数值或数码的字符。
GB/T19708--2005/S012199:20803.4
特殊字符special character
字符集中的一种图形学符,它既不是字母又不是数字,也不是间隔字符。示例:空格字符就是·一个特殊字符衍。3.5
联体字符Iigatnre
两个或多个学母连接而成的学符。注:有些情况下联体字符被视为一个独文的字母,3.6
多字母组合palygraph
为了某种用途,可视为…个字母的两个或多个连续宇母,注:包含两个或三个字母的多学母组合可分别称为二合字母和三合字母。3.7
区别符diacriticalmark
置于一个字母或一组字母的上方、下方或者从中贯通,但本身不是字母的字符。3.8
排序ordering
根据字符串的比较规则,将一些字符串排成一个明确的曦序的操作。4准备工作
在按字母排序的过程中,字符申的比较是按照一定的规则进行的。本标推规定了用于字母序的规则,但是没有涉及选择相关字符串的方法,也有提出按指定用途可能需要对字符串逃行作么样的修改。因此在使用这些排序规则之前需要根据具体情况进行下列准备工作。一一可能需要先选择出与主题有关的字符申,例如可能需要从语料库中提取出与主题有关的术语:一可能需要对字符串作适当的修改,例如可能需要把句首的大写字母改成小写字母,或需要把单调的复数形式改成单数形式等等;可能需要添邮前导寒惑前导空格,倒如在包含数学的序列中加颠导苓。多学母组合接独立学母组成的厚刻来处理。应用某排序规则时可以按几种排序方法来排列资料,并菜用几种各自独立的比较方法来决定排列顺序。但本标推只使用一种规则(按字符申比较方法)来排序。在排序时只考虑字符串中出现的字符及其排列顺序。除了排序规则外·并不使用字符串中单词的其他方面的知识.例如不使用有关法,讲音和语义等方面的调典资料或规测。5第一级排序
5. 1 第一级排序值
在比较要排序的字符串时,菌先要考虑的是字符串的第一级排序值。当两个或两个以上的学符串第一级排序值相等时,才需要考虑下一级排序值。对多语种的排序,应使用下刻排序规则(见附录A,逐词排序)5.2第一级序的顺序
数字和字母有下列的排序值:
a)数字.0123456789
注1:数字的顺序如果由左向右排序,则可得出如下次序;1101001111011112191902213,注2:如果已经涨加了前导零,则可得出这样的次序:00010002000300100011C01200190021010001100111 0190.
基本拉门字母
GB/T19708—2005/ES012199:2000gGhHiljdkkILmMnNoppqQrRsstT
aAbBccdDeEfF
注1:为了能在多语种的环境中使用这个顾序,就要尽量避免同个别语种发生冲突。附录F列举了某些语种的字母排序规则谢离本顺序的个例。
在第一级排序中,大写字母与小写字母被视为相等(在第三级排序中不等,见第7童)。带区别符的拉字母与相应的基本拉丁字母被视为相等(见第6章)。特殊拉丁字母马基本拉丁字母按照5.3表1被视为相等。
土耳其语还区分出1/I和/,而其他语言只有i/这对。为了排列包括土耳其文本在内的多语种数据,将i/扩展姐下:
L0131/U0049
无点拉丁学母I(土耳其语)
U0069/U0049
拉丁字舟I(非土耳其语)
1/10069/U0130上加点的拉工学母1(土耳其语)还应注意,如带锐音符的无点拉丁小写字母1在正规印刷体中用(UOOED带锐音符的拉丁小写字母)裹示。然而在排序时,在第一级排序中把看作与i(U0069拉丁小写字母)相等。注2:在本标准中,UXXXX&示对应的字符在GB13000.1中的位翼,这里X是任意的十六进制的数字。拉丁字母的名称多以“拉丁小写字母\和\拉丁大写字母…”开头。当兼指小写字母和天写字母两者时,卿使用“拉丁学母·\的说法而在不会引起误解时,有时连\拉丁学母\这儿个词也可省略摊。)其他字母系统的字母
其他字母系统的宇母遵循各自已有的顺序。非拉丁字母系统间的次序应是:希腊字母、西里尔宁母、其他字斑:
注:非拉丁字母系统的字母排列顺序不科于本标准的范围。希腊宁丹系统的宇母排列顺序如下: E A M
所有的其他字符,如标点符号,则不于考虑,见第8章。5.3特殊拉丁字母和基本字母之间的对等关系按照表1,特殊拉丁字母和基本拉丁字母被视为相等。大写字母和小写字母也被视为相等。表1特殊拉丁宇母与基本拉丁字母之间的对等关察置
在 GB 13000.1中的字符名称
拉T宁AE
拉丁学母带钩符
拉丁字母C带钩符
拉丁字母门带杜
拉丁字母 D带钩符
拉丁宁ETH(冰岛语)
拉丁字母G 带钩符
拉字母 H 带杠
拉丁疗母 K 常钩符
小对学母/大写宇母在
G3 13000. 1 中的症置
130181
GB/T 19708-2005/IS012199:2000位
在 GB 13000, 1 中的字符名称
拉丁小写字母KRA(格凌兰语)
拉丁字母1带杠
拉字母ENIG(拉情语)
拉丁字母带杠
拉『联体字符()E
拉」小字母尖S(德语)
拉丁学母带杠”
无对应的大写字母
第三级排序
6.1第二级排序值
表1(续)
小写字母/大每字母在
GB13000.1中的位置
UO!413
如果两个学符串的第一级排序值相等时,应按6.2规定使用第一级排序值,比较顺序应从左到右,6.2特殊拉丁字母和带区别符的字母在表1中视为与基本拉丁字母相等的特殊拉丁学母,应按表1中的题序排列。区别符应按表2中的颇序排列。
注:为了能在多语种的环境中使用这个顺序,就要尽量避免同个别语种的学母排列顺序发生冲突。附求F列举了某些语种的字补排续规则编离本顾序的个例。表2区别符的排序
040心
锐音符
钝音符
短音符
短名符和锐育符
短音符剩纯音符
:短音符和.上加钩符
短音符和波彤符
短音符和下加点
短音符和下加逗号
人字符
人字符和锐音符
人学符和钝齐符
人字符和上加均符
人学符和被形符
人字符和卜加点
区别符在 GB 130rO.1中的位置
下加人字符
倒人宇符
衡人字衍和2形符
上加圈
上如圈和锐音符
双点符
双点符和下加点
双点符和长音符
双锐音称
上加树符
波形符
上加点
下加点
加乙形符
F:加和下加迟号
小尾符
长畜符
长音符和下加点
下加长音符
前加撤号()
后加撤号(\)
角符和锐音符
角符和钝符
角符和上加钩符
角符和波形符
:角符和如点
日基本学符的上方和下片均加遇号7
第三级排序
7. 1 第三级排序值
表2(续)
GB/T19708-—2005/ISO 12199:2000区别符在GB13000.1中的位署
TJ0323
U0313 和 U0326
TJ0304
如果两个符串的第一级和第一级排序值相等时,应根据7.2的规定使用第三级排序值。比较顺序应从左到布。
7.2以大写字母开头的排列顺序
小写学母应置于相应的大写字母之前(见5.2 bh))。注:术语\小写字每\和\大写字母”分别指\·b.\和\A.”GB/T19708--2005/IS012199:20008第四级排序
8.1第四级排序值
如果两个字符审的第一级、第二级和第二级排序值相等时,应根据8.2的规定使用第四级排序值比较顺序应从左到右。
8.2按照特殊字符排序
特殊字符应按ISO/1EC14651中默认模板的顺序进行排序。对于大多数特殊学符来讲:这也就是(B13000.1中列出的排列顺序
注:在逐词排序中(见附录A)+空格字符和其他字符可能有特殊功能,即作为关键词分隔符。A. 1背景
(规范性附录)
逐词排序规则
GB/T19708--2005/IS012199;2000本标准只规定了宁符串的逐宁母排序规则。遂词排序也是一个被广泛应用、可以替换本系统的册序系统。表 A,1举例说明了逐字母排序和逐词排序的区别,表 A1逐字母排序和逐词排序的区别逐字母排字
Adhesive
ad hoe
ed ininirum
Adipose
A.2多关键字排序
ad hoc
ad iefinitum
adhesive
adipose
遵词排序
本标准的正支描述了单个关键词的排序现则。在多关键词排序中,应按照本规则先对等一个关键词进行排序,排序宪毕之后再对下.…个关键词进行排序,直到所有的关键词都考虑过之后或尼确立了唯的顺序为止。
注:多关链词排序一个典型的例了是会议的代表名单,名单中第一个关键词可能是代表所属因家的名称,第二个关键词部能是代丧的姓;第二个关键词可能是代表的名字。在这个例子中,如果一个国家只位代表,那么第…个关链词的姓就不必再考虑了。4.3分隔符
在逐词排序中,…般以空格字符作为关键词的分隔符(也可以规定其他字符为分隔符)。分隔符只起到分隔关键词的作用,它们不参与排序,当字符串被划分成一连串的关键词时,本标准的排序规卿选只用于一个关键词。注1:除空格字符以外,其他的标点符号也可以被定义为关键词的分隔符.述可以只把一部分空格字符定义为关键词的分隔符,而其他空格字符仍然作为特殊字符在关键词内使用。如何选择.取决于字衍串的类型,汁2:如果把空格亨符和连守符都作为关键词的分隔符,可以将店面的佩句\Word-by-woruurderinksmultiplc-kcyardering\分制成以下关键学;Word by uxrdurdering,as multipie ky>.ardering>,每个关键词放在\\和\”之间。为了提高可读性,还添期「了空格,4.4简单的逐词排序
如果要使用逐词排序法进行排序的文本所包含的特殊拉」字母和区别符不多的话,则对本标谁的规定可作以下扩展:
在第一级排序中(见 5.2),增加空格字符作为 a)项,丁是6,2 中的原a)项,b)项和)项就变成 b)项、c)项和l)项。而在第四级排序巾,不把空格字符视为特殊字符(见第8章)。注:想据语种以政所要排序的字符串类不同:也可把具他特殊毕符(例如连学符)作为究络字欲处理。GB/T19708—2005/ISO12199:2000B.1背景
附录B
(资料性附录)
辞典与术语排序的特殊规则
在辞典与术语应用的场合,除本标推正,文中所描述的规卿之外有时还需要增加补充排序规则。本附录中所描述的特征不容易用ISO/IEC14651中规定的形式来描述B,2相对于基线的位罩
在排序时,有时需要区别李符与基线的相对位置,如 1m2,m、mz。建议在第三级排序时,对大小写进行排序(见第7章),字符与基线的相对位置的排序,可根搁表B.1来确定。表B.1字符相对于基线的位置
紧靠在基线上的字符
B.3按照字体排
在基线上面的宁符,上标宁符
在基线下面的宁符,下标宁符
如果按照第到第四级排序都不能得出一个唯的顺序,那么可以考虑把印别宁休作为第五级排序。字体排序可按照表B.2进行。表 B.2字体排序
宁体名称
罗马宇体
黑斜体
ahednfghij
abcdefghii
ahcdefghij
abedefghijWww.bzxZ.net
c.1背景
附录C
(资料性附录)
化学名称的排序规测
GB/ 19708—2005/IS0 2199:2000对于化学名称,目前没有公认的排序规则。若需要,也可用本标雅结合附录A中述的对逐词排序的扩展规则对化学名进行排序。然面有些素引和数据库、儿其是化学文摘社ChemicalAbstractsService(CAS)门的索[和数据库使广专门设计的多关键字段排序系统。下面概述该系统的主要特征。C.2树分成三个关键字段
C.2.1 母体名
第一关键字段包含母体名,母体名通常包括罗马字舟和空字符,其中可能夹杂有斜体字母、希腊宰母、数字或特殊字符(如标点符号)。C.2.2首位要素
第二关键字段包含首位要索,首位要素是指在第:个罗马字呼前的所有字符。C.2. 3 其他要素
第三关键字段包含非首位要素、即所有的剩余字符,注:\2-Butanone-1-1,1-d,3,3-dimethyl\的名称可披划分为如下二个关键字段:.R.:ranone dimethyl><2-> --l, 1,1. uta.3.3 C.3各美键字段内的排序规则
第一关键宇段按照本标谁正文的规测进行排序。在第二和第三关键字段中,排序方法如下;-拉丁学母系统的字母(用斜体学),按 5,2 h)中指定的顺序;希腊字母系统的母,按5. 2 c)中指定的顺序;--数字按数值的序排列。
C, 4 排序结果示例
表C,1为按本附录所描述规则排序得出的结果与按本标准正文规则排序得出结果的比较。表C.1两种规则排序结果对比示例按照附录C的颁序
Bramine fluride(BrF, )
Bromine fluoride(BrF,)
2-unol(R)
2-Butunol.($).
2-Hutano,sndium sait,(.S)-
2 Bntael.1 hlt
[-But.anonr:
按照一般规则的烦序
1 Butanone,i-phenyl-
2-Butanl. 2-chloro-
2-Rulatcl,4-(trimethylstannyl)2-Hutatal.(R)
2-Butaul.(S)-
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。