中华人民共和国国家标准
信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面Information technology -Universal Multiple-OctetCoded Chararter Set (ucs)-
Part 1: Architecturc und Basic Multilingual PlaneGB 13000. 1--93
[S0/IEC 10646. 1- -1993
本标准等同采旧国际标准IS0/IEC10646,I—1993信息技术通用多八位编码字符集(LiCS)第·一部分;体系结构与基本多文种平面》1主题内容与适用范围
行13D0规定了通用多六位编码学符案UCS),它可用于界上存种语合的书面形式以及附加符号的表示、传输、交换、处理、存储、输人及显现。GB13000的这-部分规穿LICS的总体体系结构,以及:a.定义在GB-3000中使用的术语:h.描述本编码字符集的总体结构;c.
规定 UCS 的基本多文种平面(MP),并定义一个用于世界范用约冬种文字及各种语言书面形式的图形字符巢;
d.规定 BMP 的图形字符的编蚂表示及名称+e
规定LCS的肆八位(32位)正侧形式:UCS4:规定LCS的双八位(16位)BMP形式:UCS 2;规定控制功能的编码表示,
规宦未来对求缔码字符进行补充的管理办法。UCS 是一种与 GB 2811 所规定的编码体客不同的体系。从GB 2S1I中指明 LICS 的方法规定F17.2,
2符合性
2.1总则
在任何情说下,只要按本国家标准规筐的方法恢用专用字符,那么,下列符合性的要求便不再适用于这些专用字符本身。
2.2信息交换的符合性
如符合以下条件,便砍在用工交换的编码信息内的编码字符衍数提元素符合本国家标准年:在该端码宇符数据素内的全部图形宇符的编码表示都符合第章和第7章,及选自第14章的--种已标认的形式,并,且还符合选白第 15 章的一种已标识的实现等级:b,在该编码字符数据元素内所表示的全部图彩字符都来源于.-个已标识的下集(见第13章),c。在该编码字衍数据元素内的全部控制力能的编表示都符合第16章。符合性声明必须标识出所果用的形式,所用的实现等级以及所采用的以汇棠清单(或)学符造国豪技术监督局1993-12-24批准1994-08-01实施
单给出的子集。
2.3设备的符合性
GB13000.1-93
如巢一台设备符合下列项的要求,且符合项及c项一者之一或其全部要求,则称该设备符合本国家标准,
注:“设备这一术语(在4.17中)被定义为信息处理装备中的部件,它可以传送和(或)接收在编码字符数据元素方的编码信息。设备可以指常现密义上的输入/输出设备,也可指成用程序或网关功能等进程符合性声明必须标识出一个含有下面:项中规定的描述的文档,并且必须标识出所用的形式,所采用的实现等级、所采用的以汇集清单和(或)字符清单给山的子集以及依据第16章所采用的控制功能。
设备描述:符合GB13000的设备应是一种描述的对象,所谓描述,就是象下列b和c项所分别#
规定的那样,标识出用户向设备提供字符的手段,和(或)用户接收到这些字符后的辨识方式b始发设备:始发设备必须允许它的用户提供来自所采用的子集中的任意字符,并且能够依据所采用的形式及实现等级传送编码字符数据元素内的这些字符的编码表示。:接收设备:接收设备必须能够依据所采用的形式及实现等级,接收并解释编码字符数据元素内的任何字符的综码表示,并且必须使得来白所采用的于集中的任何相应字符以用户能识别的方式提供给用户。
对于所采用的子集中没有的任何相应字符,应以某种方法向用户提示,但不必区分这些字符。往:①可通过两种方法向用户提示:用同一个字符来表示所采用的子集中不具备的字符或者,当对某类用户凸适时,提供一种能鉴别的有声信号或可规信号②关于具有再传输能力的接收投备,可参见附录H(参考件)。3引用标准
下列标准所包含的条女通过在本标准中引用而构成为本标准的条文。在出版时,所示版本均为有效。这些标准都会被修订,使用本标准的各方应探讨、使用下列标准最新版本的可能性。GB2311-90信息处理七位和八位编码字符集代码扩充技术GB5261—85文字和符号成形设备用的增补控制功能4术语
下载标准就来标准下载网下列定义适用于GB13000。
4.1基本多文种平面Basie Multilingual Plane(BMP)00组的 00 平面。
4.2块block
一组相邻接耳其有共同特征(诸如某种文字)的字符的汇集。4.3正则形式canonical form
规定本编码字符集中的字符的一种形式,它用四个几位表示每一个字符4,4编码字符数据元素(C-data-element (Coded-Character-Data-Elemcnt)被交换信息的一个元素,它山依据一个或多个已标识的编码宇符集标准的一些字符的编码表示序列组成。
4.5字位cell
行中可安排一个字符的位置。
4. 6 字符 character
供组织控制或表示数据用的元素集合中的一个元素。4.7字符边界characterboundaryGB 13000.1—93
在八位流出,某一字符的编码表示中的最后个八位与其下一个字符闷编码表示的第·个八位之间的分界。
4.8编码宁符coded chararter
字符及其码表示。
4.9编钙字符集coded characlerset一纽无歧义的规则,用于建立一个产符集和该字符集中的了符及其绵编码丧示之间的:一对成义系
4.10代码表codetahlc
示出·-种代码中分配给各八位的诸字符的表4.11组合用符combiningcharaclch本国家标准编码字符集中一个已标坂的子集中的一~种结构要素,用于与其前导的非组合用图形字符相组合,或者与个以非组合用字符为前导的组合用字符序列相组合(见 4. 13)。注:GE13000的这部分现定了包含组合用7符的若干个了集汇第。4.2兼容字符eornpatbilitycharaeter主要为现存编码字符集兼容而作为GF1300的编码字符收入的图形字符。4.13复序列composite scqucnce由一个非组合用字符后随·个或多个组合用学符所组成的图形字符的序列(见。4.11):注:用于复合序列的图形符号·-般是内该序列中每字径的图形符号的组合耐构成的。2复台房列不居字符,因此也不是GR130!字汇中的结购要素4. 14 挖制功能control [unction影响数据的记录、处理、传输或解释的一种动作,其编码表示由一个或多个八位成,4. 15 默认状态 default state在未明显地指定状态时所假设的状态。4. 16 明细代码表detailed code table示出一个个字符的代码装,并且通常示出一行之局部。4.17设备device
信息处理装备中的部件,能发送和(或)接收编码宁符数据元素内的编码信息(它可以是常规意义上的输入/输出设备,也可以是诸如应用程序或网关功能那样的进程)。4.18图形字符graphiccharecter不同于控制功能的字符,通常具有书写、打印或显示的可视表示。4.19图形符号graphic symol
图形字符或复合序列的可视衣示。4.20组group
本编码字符集编码空间的-个划分单位,具有256×256×256个字位。4.21 交换 interchange
采用信手段或可交换的媒体把字符编码数据从一个用户传送到另一个用处,4.22交互运作interwo-kin
允许两个或两个以上采用不同编码字符集的系统能翁义确切地交换字符编码数据的一种过,斯中可能涉及两种代码之间的转换。4.23八位ctet
被视为一体的一个有序的八个位(比特)的序列。4.24平面plane
纸的一个划分单短,具有256×256个字位。4.25 显现 μresentation+to presentGB 13000.1-93
书写、打印或显示一个图形等号的过程。4.26变形显现形式prcscniation form在某些文学的显现中,表示一个字符的某种图形符孕形式,这种形式依赖丁该字符相对下其他字符的位置。
4.27专用平面private use planes本编码孕符集中,其内容不击GB13000规定的面(见10.1)。4.28字汇rcpertoire
端码字符架表示的:个指定的字符集合,4.29 行row
半而的个划分单位,其有256个字位。4.30文字seript
用于一种或多种谱言的书的形试的率形学符的集合。4.31辅助平而supplementaryplanes睿纳未安排在基本多文种平面中的那些宁符的平面。4.32用产user
享用由设备提供的服务的个人或其他实体,(例如,若该“设备是代码转换器或网关功能,则用户实伴可以是诸而应用程序这样的进,)4.33区
代码表中字位的一个序列.由包含.个特定类别字符的一行或多行(整行或部分行)组成(见第8章)。
5UCS总体结构
本章描述通用多八位编码字符集(下称“本编码字符集\)的总体结构.并在图1及图2中加以说明,此结构的规范在后闻的各章中给山,在GB13000中.任何个八位的俏均出从00~FF的+十六进制记数法表示,见附录J(参号件)。本编码字箱集的正则形式,它的表达方法,恢用「一个被现为单:实体并由12B·个三维的组组成的四维编码空间,
注:闵此,缩码字符的止正则形式中最高八位的第8位叫用于设备的内部处理,只要在符合标准的编综码字符数据元率内其值被置为宰
每个组包今256个二维平南。每个下面包含256个-一维行,每个行包含256个字位。-一个字符被安排并编码于这个编码空间的一人字位上,否则,则声明该字位末被侠用,在止则形点中.用四个八位来表示每一个产符,并相应地指穿组、平面、行和字位,由于两个八位不足以包容过界上所右的符,而32位的表示义符合现代处理系统的体系结构,所以正则形式由四个八依组成。
肆八位正则形式可用作肆八位编码字符集,此时称它为CS-4,第个平面(00组中闪00平面)称作基本老文种平面。它包括字盘文字,音节义字及表意文字中通常使用的字符以及各种符号利数。BMF还有一个限制使用(RUJ)区,在此区中,宁符具有特殊的性状。其后的平面被视为辅助平而或专用乎面,用下容纳附归的图形学符。00组中具有平面八位值E0-FF的32个平而为·专用平面。本编码字符集中组八位值为60~7F的32个组为专用组。GB13000不规定专用区中字位的内容。每个字符均按照其组八位,平面八位、行八位、字位八位安排在本编码字对集中。除正则形式外,不国家标准又规定广-种双八位的BMP形式,内此,其本多文种平面可当作双八位编码字符集使用,标证为 UCS.2.
GB13000.1-93
为给出图形字符的了字汇,叫利用编码空间中的子集。附录G(参考件)规定了UCS的一种变换格式(UTF-1),它可用在对按照(B2311结构进行编码的控制字符的八位值敏感的通信系统中专输文本数据。6基本结构及用语
6.1 站构
GB13000规定的通用多八位编码字符集应被视为个单:的实体。整个编码字符集应被表达为包含 128 个组,其中每组有 256 个平而。每平面应被视为含有 256 行字符,每行256个字位。在表示平面内容(如图2)的代码表中水平轴应表示最低八做,其左侧八位值最小;而纵轴应表示较高八位,其项端八笠值最小。编码空间中每一轴线应出一个八笠进行编码。在每-个八位心最高位应为第8位,最低位应为第1,
相应地,分配结每一位的权应为:第8位
第7位
6.2字符的编码
第6位
第5位
第4位
第2位
第1位
一个肆八位岸列表示。该序列的在编码字符集的正则形式中,整个编码字符集内的每一·个字符须由最高八位成为组八位,最低八位应为宁位八位。这样,此序列可表示为:TTL. s.
组人位
(Graup-rtet)
平而八位
(Plane-octet)
其中,m.s. 意为最高人位,L 8,意为最低八。为省略起见,各八位文可写为
P-八位
行八位
(Row-ociet)
R-八位
字位八位
(Cell-octet)
C-八位
在适当场合,还可进一步缩写为 G、P、R 及 C。任意一个八位的值应由两个十六进制数字表示。例如:31或FE。若想以组,平面、行及字位的值来标识单个字符,则应以下列形式表示:0000 0030表示 DIGIT ZERO(数字 0)0000 0041表示LATIN CAFITAL[ETTER A(拉丁文大写字母A)当引用一个平面内的字符时,前面的四个零(表示组八位和平面八位)可以省略。例如:0030表示DIGII ZERO(整字
每个+间:251×256
个字做
(Each plant:
256×236
character
positions.1
GB 13000.1-93
(Group7F)
(FlanemofGroupa)
O组FF
(PlaneFFat Grtup (o)
组平瓦
(Plane of Grcup s
图1通用多八位编码字符集的全部编码空间cRow-
w:teti
6.3八位的次序
(Stpplementaryplanes:
GB 13000.1-93
学花niCe-ut
(l-zone)
R-区 (R zone)
些本比文种平面
学面八
(Plane-ocieti
专用半
(Frivate Uso planes)
5号A-K,1-2,0 风
和R 系血第且京规定
(LabelsA-zane.1zune,o zund
amil R-zonearw specifil in elause a,图2通用多八位编码字符集的00组表示一个字符的诸八位的序列,及其最高端和最低端,应与上述规则保持·-致。当按八位串行时,较高八位应领先于较低八位。不是按人位串时,各八位的次序可出发送者与接收者之间的协议规定,见 17.1 及附录 F(参考件)。
了UCS的特点
以下特征适用于整个编码字符集。7.1用于表示择形字符的P、R,C(平面,行、学位)各八位的值必须具有从00~FF范围内的值。用于表示图形字符的组八位的值必须具有从00~7F范围内的值。在任何平面4,不应使用代码位置FFFE和FFFF.
注:代码位置FFFE保留用作“标记”,见附录F(参考件)。代码使FFFF可用于各种内部处理,即在需要保证一个数值不会用作字符代码的情况下使用,比如终止各种表挤,或标记文本结尾。由下FFFF是最大的效八偿值,因此它还用作兰分拽索或序搜索的素引表中的终值。7.2除了那些为专用字符分配的代码位置外,GB13000中任何末安排字符的代码位置都立留待以后进一步标催化使用,不得用于任何其他目的,GB13000的未来版本将不问留给专用字符的代码位置分配任何字符。
GB 13000.193
7.3同-图形字符不能分配到个以上的代码位上。本编码字符集中有些形状相似的图彤学符,但它们用于不向的回的,并且具有不同的字符名称。7.4包含于GB13000中的兼容字符上要是为了与现存的编码字符集兼容,以保证双向代码转换不丢失信息。
8基本多文种平面
如组中 0平面是基本多文种平面(BMP)。基本多文种平面可被川作效八位编码符集,此时,它又可称作 UCS-2(见 14. 1)。
基本多文种平面分为四个区:
A-区:代码位置0000~4DFF
I区:代码位置4E009FFF
O-区;代码位置 A000~DFFF
R-区,代码位置 F000~FFFD
A-这(19903个位置)
I-区(20992个位置)
0-区(16334个位置)
R-区(8190个位置)
在BMP中从0000001F的代码位置留给控制字符,代码位置007F留给DELETE(删除)字符(见第16章)。代码位置0080009F保留。在基本多文种平面内,A-区用下字母文宁、音节文宁以皮各种符号。I区用于中、H、韩(CJK)统的表意文字(统一的东亚表意文字)。()-区解作末来标准化用。R-区作为BMP的限制使用区·它包括专用字符、变形显现形式及兼容字符(见第10章)。9其他平面
00组中的01~DF平面以及01~5F组中的00~FF平面留作术来标准化用。因此+这些代码位胃不得用于任何其他目的。
10限制使用区
限制使用区提供了只能以特定力法来使用的若十个集合的图形字符,这些字符集合包括:专用字符;
b,亨符的变形显现形式;
c.兼容字符(克7.4)。
10.1专用学符
(3B13000对专用字符未作任何方式的约束。专用字符(区)可用于提供由用户定义的字符。例如,对表意文字用户来说,这是一项共同要求。注:为使专用字符能作含义确切的交换,发送者与接收老之间必须有个协议,但该协设与 GR 13U00 无关G#13000.193
这些专用字符可作为动态再定义符(IDRCS)应用。注:为进行合义确切的DRCS交换,发逆者与接收者之间必频有个协议,但该协效与GB18000无关。GB1S未规定用来定义或设置动态再定文字符的技术。10.2字符的变形显现形式
字符的每一种变形显现形,是在其他图形字符区中所提供的宁符或子符序列的标定形式的种替代形状.而不仅仅是一种变体,从标定形式到这些变形显晚形式的变换叫能涉及替换,添加或组合。用添加、选取具有不同形状字符或用丁组合连体字的则通常极为复杂,GB13000未作规定。一般来说,本标准无意以变形显现形式来替换在本编码字符集中其他部分所规定的图形字符的标定形式。但是,由一些特定的原因些特定的应用软件可能会对变形显现形式进行编码而不是对标定形式编码,原因之一是要与现存的设备兼容。对变形显现形式的查找、排字及其他处理操作的规则己超出了GB13(300 的范围。
11专用组与专用平面
从00组中E0半面至FF平面的32个平面内的代码位置应准专用从60组至7F组的32个组内的代码位置应作专用,GB12000未现定这些代码位普的内容(见10.1)。UCS的修订与更新
本编码宁行集的修订与更新T作将出全国信息技术标准化技术委员会根据ISO/IE:10G46的修订而避行
注:在木国象障术来版本中将保持本版本中字符的名称技字符的位节不变:‘3子集
GB13UG0提供!编码图形字符子集的规范,以便用丁始发设备和接收设备的信息交换。有两种可替代使用的广集规范,即有限子集和选择广集。个被采用的子集可以包含它们中间的任-种,或者包括[述两种的组台。
13.1有限集
行限子集巾指定子集中的图形字衍的清单组成。这种子集规范使得使用了其他代码而开发的应用系统及设备能与本编码疗符集交互运作。涉及个有限子集的符合性声明,必须按GB13000定义的图形字符名称或代码位置罗列出该F-集中的图形字符.
13.2选择子乐
进择了集由GB13000定义的图形字符的汇集的清单所组成。在GB13000的每个部分的附录A(补充件)中都列出这些汇集,通过这集可以实现对宁符的选取。选择了集总是门动包托0组0)平面00行20~7E的位,
涉及·个选择子集的符合性声明,必绩按照GB13000的定义,列出所选取的那些汇集,14LCS 的编码表示形式
GB13000提供了字符编码表示的两种群代使用的形式,采用说响
1ISO/IEC10646原文规定出JSO)/IEC:JTC1/SC2进行本学符集的偿计与更新,在本国家标准中改为由我同的相成组织根据国际练准进行。
G 13000.1—93
:源内(19汇的产符可三它在GB1988中的端码衰示进行简单的加零扩充元编码:内此,当用3位!6或22位整数表示时其缔码支示其有相等的整数值:在对丁最值为零的八位敏感的实现例妇用作字符出终中)中.店辩免些巾其F多位的数组数据类型,医为正何取值为不的八立部可能被错误地解轻。对于LICS-2而可,实用至少步16位宽能数据类史为适:对于S-4而言,来用免少为32惊宽的数情类型则更为适宜。14.1双八俊BMP形式
这种码示形试犯诈使用基本多文和面中的符,每个宇符以双八惊表示在衍合双八位BMP形式的编码学符数据元素内,基本多文种平面中的--个字符应如6.2中所规定的.出和八位与学情八位两个人位组成注:山双八位MP形式长示的编码医形守符可以月16位的整数实现,以便处理。14.2肆八位止则形式
这种则形式允许使B1300C中的全部字符衍,且每个字符以肆人位表示。在等合肆八位证则形式的编码字符数据元素内-每一个字符应如6.2中所规定的·出组八位.平面六位、行八位及字偿八位组成。注:以率八位正别形式表示的缩码图形字符可认用32位的整数实现,以便处理15实现的等级
让13000现定三种实现的等级。(与览有关的)组合再字符在第23草中描述,年列一附录B(衫充件
\5.11级实现
使用1级实现时,端码字数据元素内既不得包含组合用字符的编码装示(见1),也不得包载鲜文字耳块中字符的编码表宗(见第24章)。\5.22级实现
便用2级实现时.编码学符数据儿紊内不得也含B2刘举的字符的编码表示,15.33级实现
侵用3级实现时,编码字符数据元素内可以包含仁何宁符的编码表示。16控制功能与 LCS的联合使用
木编码字符集提供了使用某些控制功能的于段,这些控制助能是按GB2311、GB5261或具有类似结构的控御功能标推以及从这些标准派牛出的标准进行编码的。这类编码控制功能的集合或严集可以与木编码字符集联个使用,这此标准将一个控制功能接个或多个八位的序列进行编码,当与本缩码字符巢·起使用CU控制字符时,按GB5261中规定·控制字符的缩码表示应填充以行合所采用的形式(第14章)八位的数目:因此,其最低八位应是GB5261中姚定的位纽,而该控制字符中教离的诸人前将具有八位(0),例如:控制字等F()RMFFET)(换直)在双八位形试中以\O0CC”表示,而在八位形式中以\G00G00C\装示。
对于一些山一个编码控制字符日元随以范出在20~7内的若十附加位组所组戒的转义序列、控制亦列以及控制串(见GB5261),其中的每个位纽均应以具行00值的-一个或多个八位填充。例如:转义片列\ESCG2/0004/00\在双八依形式中被麦示为:“001B00200040”,而在肆八位形式则为*00000010000002000000040*当与本缩码字符案一起使用(B5261的C1控制字符时+C1控制字符应按ESCFe序列(见GB5261)编码,并按上述规定填充例如:控制字符衍PARTIALLINEBACKWARID-FI.U(行部分区移,按GB:261表示应为08/12),在人位形式中被表示为\901B004”,而在肆位形式中则为\0000001300000046”。GB 13000.1-93
用于(B2311代码扩充技术中的代码扩充控制功能(诸如指明转义序列、单移及锁移等)不得与本编码字符巢一起使用。
17标识特征的声明
17.1 标识的目的与缘由
符合GB13000的编码亨符数据元素用米构成在始发者与接受者之间进行交换的编码信息的··个组合单元的部分或全部。始发者所采用的对GB13000的标识(包括形式)、对实现等级的标识以及对编码空间中任何子集的标识,都必须向接受者提供。向接受者传送这类标识的路由,卿超出了GB13000的范围。
但是,某些编码信息交换方面的标准可能.允许或要求将可用于编码字符数据元素的标识的编码表示作为被交换信息的一部分,本章为带GB13000的某种实现等级利“一种子集的UCS的标识规定了编码表示,也为GB526上控制功能中的C0集及<1集与GH13000联用的标识规定了编码表示。这类编码表示提供了.个标识数据元素的部分或全部,而该标识数据元案可以根据相关的标准包含在信息交换+fT.
如果出现两个或两个以上的标识,则这些标识的次序必须符合本章所规定的次序。注:附录M(参考件)描述了一种替代的标识方法。17.2带实现等绒的UC编码表示形式的标识当使用GB2311的转义序列时,对于由GB13000规定的ICS的编码表示形式(见第14章)和实现等级(见第15章)的标识,必须由下述指明序列之一实现:ESC02/0502/1504/06
ESC02/0502/1504/01
ESC C2/05 02/15 04/03
ESC c2/05 02/15 04/04
ESC C2/05 02/15 04/05
ESC 62/05 02/15 04/06
标识带1级实现的UCS-2
标识带1级实现的UCS-4
标识带 2级实现的 UCS-2
标识带2级实现的 UCS-4
标识带3级实现的UCS-2
标识带级实现的UCS-1
如果在一个符合GB13000的编码数据元素之内出现了这样的转义序列,则必须按第16章的规则填充。
17.3图形字符子集的标识
当使用GB5261的控制序列时,对GB13000规定的子集(见第13章)的标识,必须通过如下所示控制序列ILDENTIFYUNIVERSAIL.CHARACTER SUBSET(IUCS——标识通用字符子集)实现:CSI Ps---02/00 06/13
Ps-意为可以有任意数日的选择性参数。这些参数将取自GB13000各部分的附录A(补充件)所给出的子集汇集号。当有个以上的参数时,每个参数值都由一个值为03/11的八位隔开。参数由数字表示,而数字0~9则由八做值03/00~03/09表示。如果在:·个符合GB13000的编码宇符数据元中出现了这样的控制序列,则必须按第16章的规定进行填充。
17.4控制功能集的标识
当使用(GB2311的转义序列时,对与GB13000联用的每一个(GB5261控制功能巢(见第16章)的标识,必须足以下所示类型的标识符序列:E5C 2/01 04/00
ESC 02/02 04/03
标识GB5261中整个CO集。
标识 GB 5261 中整个 C1 集。
对于CO或C1巢的某一个子集,其终止字符F的八位值应从编码字符集的国际登记处那里取得。这些集合的标识符序列为。
ES:02/01F标识一个Co集
FSC 02/02 F款识-个 C1集
GB 13000.1—93
如果在--个符合(313000的编码宁符数据元系中出现这样的转义序列,则必须按第16章的规测避行填充,
17.5从CS返GB2311的标识
当使用GB2311转义序列时.从LCS返回GB23:1的编码体系的标识,必须是转义序列E.SC12/050-1/00,并按第16章的规贿进行填充。18代码表与字符名称清单的结构第25及26章罗列下-此明细代码丧以及用图形字符的宁符名称的清单。所有这些一起规定了各个图形字符、它们的编码长示以及用丁每一个字符的字符名称。图形符号应被视为字符的典型的=视丧示。GB13000无意规定年·个字符的精璇形滤,因为它受到所采用的字型库设计的影响。而字型库的设计义超出了G1300的范围,(B13000规定的每个图彩字符均用它们的名称-地进行标识。这并不意味有图形字符的图形符号(这些阁形字符是按此图形符号粗略成像的)总是互不相同,具有相似图形符号的阁形字符的实例是:LATIN CAPITALLETTER A(拉」大写字持A)、GREEKCAPITAILETTER ALPHA(希腊大写宝世ALPHA)和CYRIL.LICCAFITALLETTERA(西明东大写字母A)。13000未定对属1任一个字符的含义。同一个宁符在不同的国家或不同的应用中叫能行同的含义。
对宁附文字米说-安排宁符的总原则是,在任一行中的字符都人致按字母赖序排列。当这钟文卡有人小,要配对安排。但是·在某此场合此原则无效。比如,当某些文字巴有相关的现存标准时,就接照原准安排守符。代码表中的这种安排,有助下现存的标准与木编码字符集之间的转换。然而,般来说,本编码产集与其他任何编码守符集之间的转换要使用某种查表技术。本标准无意将任何一个用户所需要的字符都集在本代码衰的某个部分,实际情况也往往并非划此。
此外,征何-即文宁的型用者部会发现他们所需要的字符叫能己在木编码字符集中编码·这“点特别适合了数字,符号以及在双文字的应用系统中所使用的拉丁牢母,因雨,建议读者在使本编码字符集时,先肴第1!草中列山的块名称清单,或浏览图3中的BMP.再查春具休的代码表中有关文学、符号利数字的各行。此外,附录E(参考件)包含了·个接字顺序排列的字符名称清单。
块名称
一表包含了BMP中定义的各个块。快名称用于规定子集.见附求A(补充件)的三集汇集,块各
BASII.ATIN(基本拉文)
T.ATIN-I SUPPI.EMENT(拉」 文-1 补充)LATINEXTENDELA(拉T文扩充·A)「.ATIN EXTENDEF-B(拉文扩充-B)IPAEXTEYSINS(国际普标扩充)SPACINGMODIFIERLETTERS(进格的修御字符)COMININGDIACRITTCAI.MARKS(组合用发当符)BASICGREEK(基木希猎文)
GREEK SYMBOIS ANID COPTIC
(希文符学及非特文
9020007E
COAO--00FF
0180-024F
0250--02AF
02B~02FF
OSOf~03G
0370)~03.F
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。