首页 > 国家标准(GB) > GB 18030-2000 信息技术 信息交换用汉字编码字符集基本集的扩充
GB 18030-2000

基本信息

标准号: GB 18030-2000

中文名称:信息技术 信息交换用汉字编码字符集基本集的扩充

标准类别:国家标准(GB)

英文名称: Information technology - Extension of the basic set of Chinese coded character sets for information exchange

标准状态:已作废

发布日期:2000-03-01

实施日期:2000-07-01

作废日期:2006-05-01

出版语种:简体中文

下载格式:.rar.pdf

下载大小:7409541

标准分类号

标准ICS号:信息技术、办公机械设备>>35.040字符集和信息编码

中标分类号:电子元器件与信息技术>>信息处理技术>>L71编码、字符集、字符识别

关联标准

替代情况:被GB 18030-2005代替

出版信息

出版社:中国标准出版社

书号:155066.1-17504

页数:平装16开/页数:/字数:

标准价格:85.0 元

出版日期:2004-03-26

相关单位信息

复审日期:2004-10-14

起草单位:信息产业部电子工业标准化研究所

归口单位:全国信息技术标准化技术委员会

发布部门:国家质量技术监督局

主管部门:国家标准化管理委员会

标准简介

本标准适用于图形字符信息的处理、交换、存储、传输、显现、输入和输出。 GB 18030-2000 信息技术 信息交换用汉字编码字符集基本集的扩充 GB18030-2000 标准下载解压密码:www.bzxz.net

标准图片预览






标准内容

GB18030—2000
本标准作为GB/T2311体系的宁符编码标准,规定了信息交换用的基本图形字符及其二进制编码的十六进制表示。
本标准适用于图形字符信息的处理、交换、存储、传输、显现、输入和输出。本标准是对GB2312的扩充。
本标准具体规定了图形字符的单字节编码和双字节编码,并对四字节编码体系结构做出了规定。本标准的附录 A、附录 B.附录 C,附录 D 和附录 E 是标准的附录。本标准从生效之日期起,同时代替原国家技术监督局标准化司和原电子工业部科技与质量监督司联合以技监标函[1995]229号文发布和实施的技术规范指导性文件汉字内码扩展规范(GBK)》1.0版。
本标准由中华人民共和国信息产业部提出。本标准由信息产业部电子工业标准化研究所归口。本标准起草单位:信总产业部电子工业标准化研究所、北京大学计算机技术研究所、北大方正集团、北京方正新天地总网络科技有限卖任公司、四逐集团公司、中科瞻款件所、长城软件公司、四通利方公司、中软总公司、金山软件公司.联想公司。本标雄主要起草人陈望球、黄疆、胡万进,张建国、陈壮。25
中华人民共和国国豪标准
信息技术
信息交换用汉字编码宇符集
基本集的扩充
Infarmation technologyChiuese ideograms coded character setfor information Interchange-Extenslon for thebaslc set1范墨
GB 18030—2000
本标准作为GB/T 2311 体系的编码字符标准,规定了棺息交换用的图形字符及其二进制编码的十六进制表示。
本标准适用于形字符息的处理、交换、存储、传输、显现、输人和辅出。2引用标准
下列标准所包含的兼文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被能订,使用本标准的各方应探讨使用下列标准最新版本的可能性。GB/T2311—1990信息处理七位和八位编码字符集代码护充技术(eqVIS02022,1986)GB2312—1980信息交换用汉字编码字符集基本集GB/T11383—1989信息处理信息交换用八位代码结构和编码规则(idtISC)4873.1986)GB/T12345—1990信息交换用汉学编码字符集辅助集GB 13000.1一1993信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面(idt ISO/IEC10646-1—1993)3原则
本标推向下与国家标推B2312信息处理交换码所对应的事实上的内码标推兼容。本标推在字汇上支持GB 13000.1 的全部中、月,韩(CIK)统一汶宇字符和全部 CJK 统一汉字扩充A的字符。
4定义
本标难采用下列定义。
4.1字汇repertoire
用编码字符集表示的一个指定的字符集合。4.2学符character
供组织,控制或表示数据用的元素策合中的一个元素。4.3编码字符coded character
宇符及其编码表示。
4.4保留区reservedzone
本标准中留作未来国际标准规定的区域。国象质量技术监督局 2000 - 03 -17 批准2000-03-17·实施
5李汇
GB 18030—2000
本标准收录的字符分别以单字节、双字节和四字节编码。5.1单字节部分
本标准中,单字节的部分收录了 GB/T 11383 的 0x00 到 0x7F 全部 128 个字料,5.2双字节部分
本标准中,双字节的部分收录内容如下:a)GB 13000.1—1993 的全部CJK 统一汉字字符:b)GB 13000.1—1993的CJK兼容区挑选出来的 21个汉字:c)GB13000,1—1993中收录而GB2312未收录的我国台湾地区使用的图形字符139个,d)GB13000.1-1993收录的其他字符31个,e)G路2312~1980中的罪汉字符号;f)GB12345一1990的整排标点符号19个)GB2312—1980未收录的10个小写罗马数字,h) GB 2312- 1980 未收录的带音调的汉语拼音字母 5 个以及 和 g;i)汉学数“”
表意文字摘迷述符13个:
k)对GB 13000.1---1993增补的没字和部首/构件 80个:1)双字节编码的欧元符号。
5.3四字节部分
本标准的四学节的部分,收录了上述双字节字符之外的,包括 CJK 统一汉学扩充 A 在内的GB13000.1中的全部字符。
6总体结构
本标准中,采用单字节、双学节和四字节三种方式对字符综码。本标准中的在何一个字节均由八位二进制位串组成,任何一个八位的值均由 0x00至 0xFF 的十六进制记数法表示。单字节部分采用GB/T11383的编码结构与规则,使用0x00至0x7F码位.双字节帮分采用两个八位二进制位串表示一个字符,其首字节码位从 0x81 至 0xFE,尾字节码位分别是 0x40 至 0x7E 和 0x80至0xFE。四字节部分采用GB/T11383末采用的0x30到0x39作为对双字节编码扩充的后缴,这样扩充的四字节编码其范围为0x81308130到0xFE39FE39。见表1及图1。表1码位范画分配图
字节数
单字节
双字节
四字节
第一字节
0x81~0xFE
第一字节
0x81~0xFE
码佗空间
0x00~-0x7F
第字节
0x30 ~~ 0x3g
第二字节
x40~0x7E,
0x80~0xFE
第三存节
0x81-0xFE
第四宇节
0x30~0x39
钙位数目
128个码位www.bzxz.net
23940个位
1587600个码位
四字节字符的编码自第四个字节开始,编码码位为0x30至0x39+其次是第三个字节,编码码位为0x81至0xFE;再次是第二个字节,编码码位为0x30至0x39最后是第一个字节,编码码位为0x81至0xFE。 即:
0x81308130至0x81308139;
0x81308230至0x81308239
0x8130FE30至0x8130FE39
0x81318130至0x81318139+
0x8131FE30至0x8131FE39;
0x82308130至0x82308139;
0x8230FE30至0x8230FE39
0xFE308130至0xFE308139;
0xFE39FE30至0xFE39FE39.
GB18030—2000
注:本标准中,凡数字前标有 Ux 的表示采用十六进制,末标有 Ux 的表示采用十进制。253
首学节
第二字节
第一、二字节
晟字节
GB 18030—2000
单字节树
双字节结构
共1260纽
第三字
第国字节
第三、四学节
第三宗
总体结构图
第四字节
四字节总体结构
字符的排列显序
7.1单字节部分字符的排列瞰序
GB 18030—2000
本标准中单字节部分所有字符按照GB/T11383中相应字符的顺序排列。见图2,7.2双字节部分字符的排列顺序
本标准双字节部分的字符排列顺序见附录A。7.3四字节部分字符的排列顺序
自0x81308130至0x8439FE39共50400个码位,对应本标准双字节部分未包括的所有GB13000.1的字符,按照GB13000.1相应字符的顺序排列,剩余码位保留。自0x85308130至0x8539FE39共12600个码位,为本标准的保留区,留待未来学符扩展使用。白0x86308130至0x8F39FE39共126000个码位,为本标准的保留区,留待未来汉字字符扩展使用。
自0x90308130至0xE339FE39共1058400个码位,用于对应GB13000.1的16个辅助平面,字符排列顺序完全遵照GB13000.1的16个辅助平面的相应码位顺序依次排列,剩余码位保留。自0xE4308130至0xFC39FE39共315000个码位,为本标准的保留区,留待未来标准扩展使用。自0元FD308130垒0xFE39FF39共25200个码位+为用户白定义区。8码位分配
8.1单字节部分的码位分配
本标准中,单字节的部分的码位分配见GB/T11383。见图2。25.5
2双字节部分的码位分配
GB18030—2000
图2单字节区码位图
本标准中,双字节的部分的码位安排分为x8140至0xFE7E和x8180至0xFEFE两部分,共23940个码位。见图3及表2。
肯学节
0xA8-0xA9
双字节5区:
192码位
汉字区(21008)
双学书3区:6080码位
恩字节
双字节用户区3+672码位
双字节4区:8160码位
oxA0 oxA1
图形符号区(1038)
双字节1区:846码位
双字节用户区1+564码粒
双字节2区:6768码位
双字节用户区2:658码位
用户自定文区(1894)
图3双宁节分编码空间结构图
总计:23940个码位
GB 18030—2000
符号区
汉字区
用户自
定文区
双字节1区
双字节5区
双字节2区
双字节3区
双字节4区
双字节用户区1
双字节用户区 2
数宁节用户区 3
GB18030-2000
表艺双字节部分的码位安排
码位范围
A1A1--A9FE
A840~A9A0
B0AI--F7FE
8140~A0FE
AA40--FEA0
AAA1--AFFE
F8A1~FEFE
A140A7A0
码位数
字符数
字符类型
图形符号
图形号
本标准中,双字节部分的汉学区(即双宇节2、3、4区)里,CJK统一汉字在前,增补汉字在后。其中GB2312的缩码汉字安排在双字节2区。GB13000.1中选山的21个CJK兼容汉字编码在双字节4区的 0xFD9C 到 0xFDA0 和 UxFE40 到 0xFE4F。增补汉字和部首/构件 80 个编码在双字节 4 区。GB13000.1中收录而GB2312未收录的我国台湾地区使用的图形字符139个,改字数字*\和表意文字描述符 13个编码在双字节 5区。GB2312中的非汉字符号、GB2312未收录的带音调的汉语拼音字每5个以及口和9,GB2312未收求的小写罗马数字10个,GB/T12345的竖排标点符号19个和双宇节编码的欧元符号(码位(xA2E3)编码在双字节1区。
B.3四字节部分的码位分配
四字节部分的码位分配见7.3条。258
A1表的内容
GB 18030—2000
附录A
(标准的附录)
双宇节字符衰
本表给出本标准双字节部分的全部GB13000.1代码及其相应字形。衰的说明
示例如下:
第一字节
第二字节高位
第二字节低位
双字节3区
GB 13000.1字形
GB 13000.1代码
2+日+
GB 18030—2000
双字节1区
上:3
GB18030—2000
双字节1区
10元8
30+点
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。