YD/T 2142-2010
基本信息
标准号:
YD/T 2142-2010
中文名称:基于国际多语种域名体系的中文域名总体技术要求
标准类别:通信行业标准(YD)
标准状态:现行
出版语种:简体中文
下载格式:.zip .pdf
下载大小:694842
相关标签:
基于
国际
多语种
域名
体系
中文
总体
技术
标准分类号
关联标准
出版信息
相关单位信息
标准简介
YD/T 2142-2010.General technical specification for Chinese domain names.
1范围
YD/T 2142规定了在互联网体系上使用中文域名的总体技术要求,规定了使用中文域名的解析体系要求,并对中文域名的注册管理提出相应的规范。
YD/T 2142适用于各级域名注册管理机构、域名注册服务提供商以及软件厂商开发支持中文域名的应用或者服务等。
2规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注8期的引用文件,其最新版本适用于本标准。
ETP RFC 1034 域名的概念与应用
IETF RFC 1035 域名的实现与规范
IETFRFC 1122 互联网主机传输层要求
IETF RFC 1123 互联网主机的应用与支持要求
IETF RFC 2234 语法规范的扩展巴科斯范式: ABNF
IETF RFC 3454 国际化字符串预处理
IETF RFC 3490 国际化域名与应用
IETF RFC 3491 国际化城名预处理
ETF RFC 3492 一种适用于国际化域名应用的对统一码的编码方法: Punycode
IETF RFC 3743 国际化域名的注册管理指南
IETF Draft- xdlee-idn-cdnadmin-05中文域名注册管理指南
3缩略语和术语
3.1缩略语
下列缩略语适用于本标准。
CDL Chinese Domain Label 中文域名字段
CDN Chinese Domain Name 中文域名
标准内容
中华人民共和国通信行业标准
YD/T2142-2010
基于国际多语种域名体系的
中文域名总体技术要求
General technical specification for Chinese domain names2010-12-29爱布
2011-01-01 实施
中华人民共和国工业和信息化部发布前
1范围·
2规范性引用文件
3缩略语和术语:
3.1缩略语
术语··
4解析体系·
应用要求和适用性·
学符转换操作
使用DNS的典型应用
5注册管理机制
5.1中文字符变体·
5.2注册管理
附录A(规范性附录)中文异体对照表句法规定附录B(资料性附录)中文异体对照表示例次
TYKAONYKAC
YD/T 2142-2010
YD/T 2142-2010
本标准主要采用了ETF的标准RFC3490国际化域名与应用》(英文版)和RFC3743国际化域名的注册管理指南(英文版),根据RFC3490和RFC3743,以及我国的实际情况起草的,目的在于推动中文域名在中国的应用、发展和普及,有利于在中文用户群体中推广使用中文化的域名。本标准在技术内容上与 RFC 3490和 RFC 3743 保持一致,实现本标准与实现RFC 3490 和 RFC 3743 的结果是一样的。
本标准是中文域名标准系列中的第一个标,它包括了核心的解析体系规范以及注册管理规范,是制订其他中文域名标准的基础。该系列标准的名称和结构如下:1、基于国际多语种域名体系的中文域名总体技术要求2、基于国际多语种域名体系的中文域名的编码处理规范3、基于国际多语种域名体系的中文域名的一系列应用协议规范和协议测试规范4、基于国际多语种域名体系的中文域名的一系列软件设计规范和软件测试规范5、基于国际多语种域名体系的中文域名注册实施规范本标推的\范围\一章是根据GB/T1.1-2000的规则编写的;第3章“术语和定义\是将RFC3490和RFC3743中的术语和定义修改归集,并增加了一些适合本标准的特定的术语和定义;第4章和第5章,分别依据RFC3490和RFC3743的基本思路:将其中有关国际化成名的规定都转换成只针对中文域名的规定,以符合中国国情,但是其技术思路并未作修改。本标准的附录 A 是规范性附录。本标准的附录B是资料性附录。
本标准由中国通信标化协会提出并归口。标准起草单位:中国互联网络信息中心(CNNIC)。标准主要起草人:李晓东、钱华林、毛伟、孙国念、王艳峰、姚健康、陈卉。引言
YD/T2142-2010
互联网是一个基于开放互联协议的网络,域名是互联网上的基础服务,是用于识别和定位互联网上计算机的层次结构式的字符标识,与计算机的互联网地址相对应。基工域名可以提供Www、E-mailFTP等应用服务。
实现对中文域名的支持首先应实现对国际化城名的支持。该标准的引I用RFC3490是国际化域名的标准。RFC3743是针对中日韩的文字字符存在异体的问越而设计的。本标准的第4章主要对应RFC3490,主要规定了如何在应用程序中实现对中文域名的支持。本标准的第5章主要对应RFC3743,主要规定了中文域名的注册指南。娶实现对本标准的支持,亦可接参照RFC3490和RFC3743。随着互联网的发展,中文用户的数量不断增加,对于中文域名的使用需求也在增加。但是中文域名和传统的英文域名有较大差别,比如,域名字段分隔符(中文句点和英文句点)不同,中文字符有多种形武(包括简体、繁体、异体、古体等等);并且中文域名的字符集比传统的英文域名的字符集大很多。为了规范中文域名的使用,让中文用户能够方便的通过中文域名来使用互联网的各种应用服务,尽快制定中文域名标准,进而推动中文域名的使用是十分重要的。YKAoNYKAca
1范围
YD/T2142-2010
基于国际多语种域名体系的中文域名总体技术要求本标雅规定了在互联网体系上使用中文域名的总体技术要求,规定了使用中文域名的解析体系要求,并对中文域名的注册管理提出相应的规范。本标准适用于各级域名注册管理机构、域名注册服务提供商以及软件厂商开发支持中文域名的应用或者服务等。
2规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款:凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。ETF RFC 1034
IETF RFC 1035
IETF RFC 1122
IETF RFC 1123
IETF RFC 2234
IETF RFC 3454
IETF RFC 3490
TETF RFC 3491
ETF RFC 3492
ETF RFC 3743
域名的概念与应用
域名的实现与规范
互联网主机传输层要求
互联网主机的应用与支持要求
语法规范的扩展巴科斯范式:ABNF国际化字符审预处理
国际化域名与应用
国际化域名预处理
一种适用于国际化域名应用的对统一码的编码方法:Punycode国际化域名的注册管理指南
ETFDraft-xdlee-idn-cdnadmin-05中文域名注册管理指南缩略语和术语
3.1缩略语
下列缩略语适用于本标准。
3.2术语
Chinese Domain Label
Chinese Domain Name
Chinese Domain Names in ApplicationsDomain Name System
Letters Digits Hyphen
下列术语和定义适用于本标。
中文域名字段
中文域名
中文域名与威用
域名系统
字母、数字、连接符
YD/T 2142-2010
LDH-DNS
根据RFC1034域名的概念与应用》和RFC1035《域名的实现与规范的定义,只允许使用26个英文字母,数字0到9以及连接符“\作为字符的域名系统。本标准在后续的阐述均将这种域名系统称为LDH-DNS系统,LDH即Letter、Digit和Hyphen三个英文单词的首字母简写。3.2.2
通用字符编码
通用字符编码根据其位置或码位来识剃字符,给每个字符提供的一个惟一的数字。比如锐,U+4E96指的是在通用字符集中位于4E96处的字符。本标的通用字符编码采用了ISQ/IEC10646-1:2000,通用字符编码的集合称为通用享符集。3.2.3
分隔符Dejmiter
LDH-DNS域名中的英文句点或中文域名中的中文句点,3.2.4
城名字段Label
域名中由分隔符隔开的几个部分。例如:对于一个完整的域名\cnnic.cn.\,“www\、“cnnic\\cn\分别是三个域名字段。
Chinese Domain Label
中文域名字段
含有中文字符的域名字段。
中文域名ChineseDomalnName
含有中文域名孚段的域名。
解析器Resolver
解析器负责接受应用程序的域名查询请求,最终由它来向域名服务器发送域名查询请求,并负责按受域名服务器的返回信息,再将结果发给应用程序,从而完成整个查询过程。3.2.8
中文域名与应用CDNA
关于如何在应用程序以及某些应用环境中使用或者实现中文域名的协议,它允许使用某些LDH字符(以特殊的前缀开始)来表示非LDH字符:不改变现有的域名服务器,解析器,或是协议单元,与下层协议无关,不需要改变现有的网络结构。3.2.9
域名描DomainName Slot
被设让用来携带域名的协议元紊,函数参数、函数返回值等,例如:域名查谢中的QNAMB字段。3.2.10
TTYKAONYKAa
YD/T2142~2010
是用于存储域名的数据库,它是域名空间树状结构的一部分,城名服务器是以ZONE为单位来管理域名空间的,ZONE中的教据保存在臂理它的域名服务器中。当在现有的域中添加子城时,该子域既应可包含在现有的ZONE中,也应可为它创建一个新ZONE或包含在其他的ZONE中。一个域名服务器应前管理一个或多个ZONE,一个ZONE应可保存在多个城名服务器上。3.2.11
Punycode
一种编码转换规则。运用这种规则应可实现通用字符编码字符串和LDH字符串的相互转换。3.2.12
LDH编码前缀
由两个LDH孚符后跟着两个连字符(其中学母不区分大小写)进行衰示的前缀。用于中文域名的LDH编码前缀是\xn--\。
DNs资源记录DNsResourceRecord用于描述DNSZONE信息的基本组成结构,包括:资源记录所有者(Owmer)、记录类型(Type),协议类型(Class),生存间(TTL)、记录数据(Rdata)等。详见RFC1034和RFC1035。3.2.14
存储字符串StoredString
用在协议标识符和名称实体中的字符申。3.2.15
查询字符串QueryString
用于和已保存的标示符相匹配者相比较的字符串,例如域名套询中的域名部分。3.2.16
异体对照表Language Variant Table在域名注册和管理时用到的字符表。表的格式分为三栏,第一栏为有效字栏,第二栏为建议字栏,第三栏为异体字栏,异体对照表是域名注册和理的基础。3.2.17
有效字 Valid Code Point
在异体对照表中,位于第一栏的码位。这一栏中所有字符的集合构成了特定语言的有效字集合,这个集合用来检查用户注册域名的合法性,只有城名所有码位均属于这个集合,域名才被认为是合法的。3.2.18
建字PrefarredVarlant
在异体对照表中,位于第二栏的码位。这一栏对应有效字栏。建议字表明了有效字在特定语言或者特定语言书写环境中的建议值,它构成的变体域名字段通常被注册在ZONB文件中。异体对照表中的建议学栏用来生成建议CDL。
异体字CharacterVariart
YD/T2142-2010
在异体对照表中,位于第三栏的码位。这一栏对应于有效字在特定语言或者特定语言书写环境中的异体。异体字与建议字不同,基于异体字的替换通常被保留而并未注册(激活)。异体对照表中的异体字栏用来生成异体CDL
CDL包CDLPackage
在特定的ZONE内成功注册CDL时产生含有CDL的包:包内的所有CDL应被\保留”;除了包的持有者外,包内的所有CDL不能被任何人注册。这些被保留的CDL可能被激活写入一个ZONE文件中。CDL包同时也包括与注册过程相关语言的标识。初始CDL及其包内所有CDL构成了一个单一-的原子单元。3.2.21
字符串预处理Stringprep
按照RFC3454《国际化字符串预处理》的规定,对字符串进行处理的过程。3.2.22
名字预处理Nameprep
按照RFC3491《国际化域名预处理》的规定,对字符串进行处理,其目的是使其可以用于域名字段或者检查其是否可以用于域名字段。4解析体系
本章确立了一个如何在应用程序中实现中文域名或者在应用环境中使用中文域名的协议框架,该框架最核心的内容是规定了如何在整个DNS解析体系中支持中文域名,该框架称为中文域名与应用(CDNA)。
LDH-DNS只能使用字母、数字和连接符组成的编码,而中文域名允许使用更大的字符集。CDNA采用向后兼容的表示法,用于解决在域名中使用中文字符集的问题。只要某种应用(包括 DNS ZONE 文件和解桁器接口)支持 LDH字符,应可使用 CDNA来支持 CDN。CDNA完全包括在具体应用中。需要使用域名解析时应在应用和解析器之间使用 CDNA,需要在域名写入DNS ZONE时,应在域名放入ZONE之前使用 CDNA。本标准规定了两种操作:1)LDH字符转换操作,应该用于将CDN发送给仅支持LDH字符的设备(比如解析器)之前,或是把CDN写入仅支持LDH享符的文件(比如DNSZONE文件)之前使用,2)通用字符编码转换操作,用于向用户显示域名时使用,例如:将DNSZONE中取出的域名显示给用户。
两种操作中,LDH字符转换操作可能会失败;如果对某个域名使用LDH学符转换操作尖败,则此域名不应作为中文域名使用,相应的有一些错误处理。在进行两种操作前,域名的编码格式应是通用字符编码:如果域名使用其他编码方式,应先转成通用字符编码(LDH码位也属于通用字符编码码位)。CDNA应对输入字串进行\nameprep\(详见RFC3491),“nameprep\是\stringprep\(详见RFC3454)在 CDNA中使用的具体表述,之后进行 punycodle(详见 RFC 3492)转换。实现CDNA应实现\nameprep和\punycode\,两者缺一不可。4
TYKAONYKAa
4.2应用要求和适用性
4.2.1应用要求
CDNA规定了以下四个应用要求:YD/T2142-2010
1)当点作域名字段分隔符时,以下这些字符也应等同于点:U+002E(英文句号\\),U+3002(中文句号\。\).U+FFOE(全角句号\,\,U+FF6I(平角中文句号。\)。2)如果域名进入不支持CDN的域名槽时,此城名应只包含LLH码,应通过LDH字符转换操作来获取LDH形式的域名,如果点用作域名字段分隔符,则应把所有这些域名字段分隔符转成U+002E。3)如果用户环境能处理非LDH形式的域名,宜对用户隐从域名槽获得的LDH域名。当不能确定环境是否支持非LDH形式时,应用应可使用非LDH形式(可能失败,比如不能正确显示),也成可使用LDH形式。中文域名的非LDH形式的等同域名应可通过通用字符编码转换操作对每个域名字段进行操作来获得:要求2和要求3同时需要满足时,要求2优先。4)当比较两个域名字段时,应比较它们的LDH形式在不区分字母大小写时是否相同。当比较两个域名时,只要相应的域名字段都和同,无论是否使用同样的分隔符,都应认为整个域名相同。4.2.2适用性
如果没有特别指出不使用中文域名,CDNA对所有域名樽中的中文域名都应是适用的。以下两种情况带要注意。
1)DNS资源记录
除非在将来有特殊规定,对于所有类别值《Class)不是IN(Lnternet)的DNS资源记录,其中的Narne和 Rdata字段,不应使用CDNA。DNS资源记录能否应用CDNA,完全由类别值决定,而不是记录类型(TyPe),没有需要特别注意的。除非有强制的特殊限制,以后新定义的记录类型的DNS资源记录也应可应用CDNA。2)域名存储的非或名类型数据
本标准没有规定存储在域名里的非域名数据是否可以使用非LDH字符。4.3字符转换操作
中文域名应可通过转换,以LDH形式放入不能识别CDN的域名槽中,或者以通用字符编码形式显示给用户。
LDH字符转换操作或递用字符编码转换操作的输入是一串特定的通用字符编码。本部分规定了转换的步骤。
转换流程示意如图1所示。
详细转换步骤如下所述:
步骤1:判断域名是“stored string\还是\query string\,如果是\query string”,标记上\AllowUnassigned”(详见RFC3491)。
步骤2:以分隔符为界,应将域名分割成几个独立的域名字段,域名字段不包括分隔符。步骤3:对每一个域名字段,应决定是否在主机名中限制只能使用LDH码。如果要限制,应为此学段标记上*UseSTD3ASCIRules”(详见RFC3490)。步骤4:对每个域名字段进行LDH字符转换或通用字符编码转换的处理:例如,把城名放入不能识别CDN的域名槽时,使用LDH字符转换操作:将域名显示给用户时,宜使用通用字符编码转换操作。5
YD/T 2142-2010
4.2.1给出了应用要求的详细规定。步骤5:如果第4步使用了LDH字符转换操作,应把所有域名字段分符转成U+002E(英文句号\\)。辅入整个域名
所城名是\storedstring”
是querystring
estored gtring
将域名分制成几个
独立的城名学段
府每个城名培息
缺定是否企主机名中限制
尽能使用LDH纯用
不茜要限制
丽学解型有
4.3.1LDH 字符转换操作
\query etring
标记上
AllowUnassiged
需要限制
标记上
\UseSTD3ASCIIRues
对每个域名字段进行LDH字符转换或通刀平符编码转换的操作
瑞香便用
LDH字符转换
命个域名字段处
现结束
把所有域名字段分
隔符转成威UH002E
图1字符转换流程
LDH宇符转换操作将域名字段由通用字符编码方式转换成ASCIL编码方式。如果LDH字符转换操作转换成功,初始域名字毅和结果域名字段应是等同的。在CDNA中应用LDH字符转换操作时,如果设置了 UseSTD3ASCIRules 标记,当输出结果含有非LDH 形式的 ASCI字符时,表示转换操作失败。转换过程中每一步的失败都可能导致LDH字符转换操作的失败,如果转换失败则此域名不应作为中文域名使用。
LDH 宇符转换操作的输入是一串通用字符编码码位,AllowUnassigned 标记和 UseSTD3ASCIIRules标记。输出是一串LD码位或者失败信息。LDH字符转换操作对已经是LDH形式的码位不作任何转换。多次运行LDH字符转换操作获得的结果和运行一次获得的结果相间。LDH字符转换的操作流程示意如图2所示。6
TYKAONYKACa
详细的步骤如下所述:wwW.bzxz.Net
入一申码位
查字符串星香
包括ASCn以外的码位
楚杏设巢
eSTD3ASCIRules
捡查克秀否出现非LDH城死
或者在开头和结尾出现
建字符
检查学符中是香
起括ASCII以外的码位
冠查率是香
SLLIH蜗肉前装开款
月punycade算法
对申进行编码
行名字预处理是否成
返回错误
在串前加上
LDE码前数
断码位的数目是
在1到63范国味
输出结果
图2LDH宇符转换摄作流程
步骤1:如果字符审包括ASCI以外的码位,跳转到第2步,否则跳转到第3步。步骤2:执行名字预处理,使用AllawUnassigned标记,若失败应返回错误信息。步骤3:如果设置了UseSTD3ASCIRules标记,进行下面的检查:YD/T2142-2010
a)确认不存在非字母数字或连接符(非LDH)的ASCⅡ码位,即不存在范围在0.2C,2E.2F.3A.40SB..60,和7B..7F之间的码位。b)确认在串的开头和结尾不存在U+002D(英文连字符“_\)。步骤4:如果串里包括除ASCI之外的码位,应跳转到第5步,否则跳转到第8步。步骤5:确认串不是以LDH编码前缓开始,否则操作终止并返回错误信息。步骤6:用 punycode编码算法对串进行编码。步骤7:在申前加上LDH编码前缀。步骤8:确认码位的数目在1~63范围内,返回ASCI形式的码位结果,否则返回错误信息。YD/T2142-2010
4.3.2通用字符编码转换操作
通用字符编码转换操作将域名字段转换成通用字符编码方式。如果输入的字符串是带有LDN前缀的LDH形式的域名字段,那么输出结果是一个等同的非LDH形式的中文域名字段:否射初始舱入的字符串不变。
通用字符编码转换操作中如果任何一步失,应将最初的辅入患作为结果返回。通用字符编码转换操作的输入是一串码位,A[IawUnassigned标记和UseSTD3ASCIRules 标记。输出是一串通用字符编码码位。
通用字符编码转换操作示意如图3所示。输入一玛位
灿断是否所有码位都在
码国内
执行享预处理是否
断字符出者
由LDH编码前级开始
返回原始输入
解码成功
保存字符串,记许r1
出除LDH缩码前级
用ptarycele进行解码处理,
保存这步的结果记作12
对舒解码结男学符中应用LDH学符转典操作.保存缩果,记作3
用不区分子母大小写的ASCI饰
比较f1和3是否相同
返回第5步保存
的结果:F2
图S通用宇符编码转换操作流程
返国原
蛤输入
步骤1:如果串中的所有码位都在ASCⅡ编码范围内(0...7F),应跳转到第3步。步骤2:执行名字预处理,使用AllowUnsigned标记,若失败应止操作,应将原始输入作为结果返回。
步骤3:确认字符审由LDH编码前缀开始,保存字符串:否则应将原始输入作为结果返回。步骤4:去除LDH编码前缀。
YKAONYKACa
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。