首页 > 国家标准(GB) > GB/T 12200.1-1990 汉语信息处理词汇 01部分:基本术语
GB/T 12200.1-1990

基本信息

标准号: GB/T 12200.1-1990

中文名称:汉语信息处理词汇 01部分:基本术语

标准类别:国家标准(GB)

标准状态:现行

发布日期:1990-02-01

实施日期:1990-08-01

出版语种:简体中文

下载格式:.rar.pdf

下载大小:428848

标准分类号

标准ICS号:信息技术、办公机械设备>>35.020信息技术(IT)综合

中标分类号:电子元器件与信息技术>>信息处理技术>>L70信息处理技术综合

关联标准

出版信息

出版社:中国标准出版社

页数:13页

标准价格:12.0 元

出版日期:1990-08-01

相关单位信息

首发日期:1990-02-01

复审日期:2004-10-14

起草人:张普、林东海、袁琦、赵珀璋、龚滨良、林宁

起草单位:武汉大学、中国船舶工业总公司709所、机械电子工业部4所、机械电子工业部计算机与信息发燕尾服研究中心、航天部航空工业部710所、机械电子工业部计算机外部设备研究所、北京语言学院

归口单位:全国信息技术标准化技术委员会

发布部门:国家技术监督局

主管部门:国家标准化管理委员会

标准简介

本标准规定了最重要的或最基本的汉语信息处理术语,它们是其他各部分的基矗本标准适用于有关汉语信息处理领域的科研、设计、生产、使用、维护、管理、教学和出版等方面。 GB/T 12200.1-1990 汉语信息处理词汇 01部分:基本术语 GB/T12200.1-1990 标准下载解压密码:www.bzxz.net

标准图片预览






标准内容

中华人民共和国国家标准
汉语信息处理词汇
01部分:基本术语
Chinese information processing--VocabularyPart 01 : Fundamental terms
GB 12200.1--90
本词汇涉及到汉语信息处理的各个主要方面,其中包括基本术语、汉语和汉字、汉字编码、汉字识别、汉语语音处理、汉语理解、机器翻译、汉语信息处理设备、汉语信息处理系统软件、汉语信息处理技术应用及其他等约11.个部分。在学科方面,本词汇具有相对的独立性和系统性。1主题内容与适用范围
1.1主题内容
本标准规定了最重要的或最基本的汉语信息处理术语,它们是其他各部分的基础。1.2适用范围
本标准适用于有关汉语信息处理领域的科研、设计、生产、使用、维护、管理、教学和出版等方面。2引用标准
GB2312信息交换用汉字编码字符集基本集GB5271数据处理词汇
3避循的原则和规则
3.1词条
词条是本标准为使用者提供的便于查检和参阅的基本单元。3.2词条的组成
本标准的词条一般由下述几部分构成:a.
索引号(不同语种文本都是一致的);术语;
术语的缩写;
允许用的同义术语;免费标准下载网bzxz
术语的英译名:
术语的英文缩写;
术语的定义;
以“例:”开头的一个或几个示例;以“注:\开头的一个或几个注释(用以说明术语应用的特殊情况);图、图表或表格。
3.3多义术语
当一个术语有几个不同的意义时,分别在不同的词条中给予定义,以便于译成其他语种,国家技术监督局1990-02-01批准362
1990-08-01实施
3.4缩写
12200.1--90
有些术语具有常用的缩写,但在定义、示例及注释中,不采用这种缩写。3.5符号的用法
3.5.1圆括号的用法
有些术语使用时,在不引起误解的情况下,可以省略掉其中一部分,可省略的部分为黑体,并用圆括号括起。在定义、示例和注释中,只用完整的术语。有些术语后圆括号内的非黑体字,不是术语的组成部分,而是用来说明该术语的使用须知和特殊应用形式或语法形式的。
3.5.2方括号的用法
当几个术语使用同个定义格式(个别词不相同)时,可将它们合并在·个词条中,个别不相同的调放在方括号中,表示可以替换方括号前面的词。方括号及其中的词在术语及定义中出现的顺序必须致。
3.5.3黑体字与犀号
术语在定义、示例和注释中用黑体字印刷时,表示该术语已在本词汇的其它词条中给过定义,并且只有它在另一词条首次出现时才印成黑体字。如果有两个已分别在不同的词条中给过定义的术语连在--起使用时,则用星号“*”将这两个术语隔开。
3.6英译名
术语所对应的英文采用美国习用的拼法。3.7索引
本标准附有汉语索引和英文索引。索引包括本部分的全部术语。根据汉语索引或英文索引,可查出术语正文的索引号。4术语和定义
4.1基本术语
4.1.1—般术语
4.1.1.1语言信息处理language information processing用计算机对自然语言的音、形、义等信息进行处理。即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作与加工。汉语信息处理Chinese information processing4.1.1.2
用计算机对汉语的音、形、义等信息进行处理,有时又称中文信息处理。4.1.1.3汉字信息处理Chinese character information processing用计算机对汉字表示的信息进行的操作和加工,如汉字的输入、输出、识别等。4.1.1.4
汉学输入Chinese character input利用汉字的形、音或相关信息通过各种方式,把汉字输入到计算机中去的过程。汉字输出 Chinese character output4. 1. 1. 5
将计算机内以数据形式表示的汉字在显示终端、印字机等设备输出的过程。4.1.1.6多文种信息处理multilingual information processing在两种或两种以上语言”文字字符集编码体系基础上,实现对多文种信息的兼容处理。民族语言支撑能力National languagesupportNLS(缩写)4. 1.1.7
使计算机具备能够处理民族语言的开发能力。例:中文化,汉字化。
4.1.2语育文字
4.1.2.1语言 language
12200.1-90
为了传递信息而使用的一组字符、约定和规则。注:同GB5271.7的07.02.01条。4.1.2.2自然语言natural ianguage一种语言,其规则是根据当前流行的用法而不是用明确的形式规定的。注:同GB5271.7的07.02.03条。4.1.2.3人工语言artificial language一种语言,其规则在使用前已明确地规定了。注:同GB5271.7的07.02.03条。4.1.2.4受限语言restricted language在词汇、句法、语义及语用等方面受到人为限制的自然语言的真子集。4.1.2.5语言模型linguistic model对自然语言的数学描述。分为生成模型、分析模型和识别模型三种。4.1.2.6语音speech sound
人类发出的能表达一定意义的声音。文字 script
人类记录和传达语言的书写符号系统。word
4.1.2.8词
最小的能独立运用的语言单位。例:大、国家、奥林匹克。
词汇vocabulary
一种语言中所有的词与固定词组的集合。4.1.2.10 语法 grammar
语言的结构规则。自然语言的语法具有一定的民族特点和相当的稳定性4.1.2.11句法syntax
词或词组之间的组合规则。
4. 7.2. 12
4. 7. 2. 13
4. 1. 2. 14
语义 semantics
词或词组与它们的含义之间的关系。语用 pragmatics
词或词组与它们的解释和使用之间的关系。文本text
语言的符号串,文字信息处理的对象。语言资料库corpus
4.1.2. 15
文本的有序集合。各种分类、检索、综合、比较的基础。4. 1. 2. 16
语言知识库language knowledge base计算机所存储的语言知识的集合。它是计算机从语音、文字、词汇,句法、语义、语用等角度对语言进行信息处理的基础。
计算语言学 camputational linguistics4.1.2.17
语言学的一个分支学科。它应用计算机技术来研究和处理语言“文字,内容包括:字频利询频统计、语音的识别与合成、机器词典的编纂,机器翻译、自然语言理解、计算机的白然语育接口等。
4.1.3汉语和汉字
4.1.3.1汉语Chinese
GB 12200.1
汉族的语言。中国境内主要的通用语言,也是国际通用语言之一。属汉藏语系。4. 1. 3.2 中文 Chinese
特指汉语。
4.1.3.3 现代汉语contemporary Chinese language现代汉民族语言。包括它的主要地域分支:北方话、吴语、湘语、赣语、粤语、客家话、闽语等。它的规范化语言是普通话。
普通话Putonghua
4. 1. 3. 4
现代汉民族共同语。它是规范化的现代汉语,以北京语音为标准音,以北方话为基础方言,以典范的现代白话文著作为语法规范。4.1.3.5
汉语拼音(方案)scheme of the Chinese phonetic alphabet,Pinyin给汉字注音和拼写汉语*普通话“语音的方案。方案采用26个拉丁字母,有声母衰和韵母表及拼写规则,对声调符号和隔音符号的标记也有规定。4. 1. 3.6 汉字 Chinese character,Hanzi记录汉语的书写符号系统。汉字也被其他-些国家或民族用作为书写符号。现代通用汉字 current commonly-used Chincse character4. 1.3. 7
现代通行的记录现代汉语的书写符号系统。例:(1)GB2312。
(2)《现代汉语通用字表》。
汉字属性 attribute of Chinesc characters4.1.3.8
汉字本身所具有的音、形、义三方面的特征及附加的有关特征。例:笔画、笔顺、部首、部件、汉语拼音方案、四角号码等。汉字属性字典Chinese character attribute dictionary4. 1. 3. 9
包括汉字部首、汉语拼音方案、笔画数、笔顺、使用频度、组词能力、文字结构、标准部件、标准字形点阵码等属性及其电报码等相关信息的数据库或字典。4.1.3.10简化字simplified Chinese character采用同音代替、改换声旁、草书楷化、偏旁简化类推等方法制定的一批笔画较少的汉字。这些字取代了对应的笔画较多的汉字作为通行的正体。特指1986年重新公布的《简化字总表》,共2235字。
例:后【俊],亿[億],发[發],说[说],难[摊]。4. 1. 3. 11
繁体学 unsimplified Chinese characten被简化字代替的笔画较多的汉字。例専[专],聖[圣}],[宁],[对],機[机}。4.1.3.12异体字variant Chinese character汉字通常写法之外的一种音同、义同,只是字形笔画或结构不同的字。例:升[升、隆],迹[、踏,泪[]。4. 1. 3. 13 分词单位 word segmentation unit汉语信息处理使用的、具有确定的语义和(或)语法功能的基本单位。汉语分词Chinese word segmenting4.1.3.14
从工程观点出发,按照特定的规范,对汉语按分词单位进行划分的过程。4.1.4汉字编码
4.1.4.1汉字[汉语词语编码Chinese character[Chinese word and phrase]coding按照一定的规则,对指定的汉字[汉语词语集内的元素编制相应的代码。汉字编码字符集 Chinese charactcr coded character set4.1.4.2
GB12200.1-90
按一定的规则确定的包含汉字及有关基本图形字符的有序集合,并规定该集合中的字符与编码表示之间一一对应的关系。
例:GB 2312。
4.1.4.3汉字编码方案Chinese character coding scheme汉字集元素映射到其他字符集元素的·组完整规则。4.1.4.4汉字编码(键盘)输入方法Chinese character coding(keybcard)input method运用某种编码方案、键盘设备及计算机资源,由操作者向计算机输入汉字的方法。4.1.4.5汉字编码输入方法评估evaluationof Chinese charactet coding input method按照约定的或法定的规则和步骤,对汉字编码(键盘)输人方法的素质和特性进行定量的测试和定性的评价等。
4.1.4.6汉字(信息)交换码
Chinese character code for information interchange汉字信息处理系统之间或者信息处理系统与通信系统之间进行汉字信息交换的代码4. 1. 4.7 汉字内部码 Chinese character internal code汉字在信息处理系统内部最基本的表达形式,供存储,处理、传输汉字用。注:它与汉字信息交换码有一定的对应关系,通常借助于某种特定标识信息来表明它与单字节字符的区别。4.1.4.8汉字控制功能码Chincse character control functian code说明汉字数据的传送控制、格式处理、汉字扩充及设备控制等的代码。4.1. 4-9 汉字字形码 Chinese character font code表达汉字学形的字模数据,通常用点阵、矢量函数等方式表示。4.1.4.10 汉字点阵字形 Chinese character dot matrix font计算机中以点阵形式表示规范化汉字字形的--种形式。4.1.5语音和文字自动处理
4.1.5.1 汉字识别 Chinese character recognitian利用计算机抽取汉字字形特征,实现对汉字的自动输入。可分为联机手写体汉字识别、印刷体汉字识别和手写体汉字识别。
4.1.5.2汉语语音识别Chinese speech recognition利用语音分析技术,抽取语音特征,实现对汉语语音的自动识别。可分为特定人和非特定人两种。
4.1.5.3汉语语音分析
fChinese speech analysis
将汉语语音模拟信号转换为语音数字信号,抽取汉语语音的特征,建立汉语语音模型的过程。4.1.5.4
汉语语音合成Chinese speech synthesis利用汉语语音信息库和语音的合成系统,合成出所需汉字、单词、短语或整创的汉语语音流。4.1.5.5汉语语音信息库Chinese speech information library利用语音分析、压缩技术,根据汉语语音特征模型(声母、韵母、声调、音节、语调、语气)建立的汉语语音数据、参数、特征数据库。汉语语音数字信号处理Chinese speech digital signal processing4.1.5.6
利用语音采样、分析、存储、合成、传输等技术,实现对汉语语音的识别、录放、舍成和通信功能。
汉语语音信息处理Chinese speech infarmation processing4.1.5.7
利用计算机系统、汉语”语音的编码技术和汉语语音数字信号处理技术,实现汉语语音输入、输出、理解、翻译、语音和文字相互转换以及语音信息通信等信息处理功能。4.7.6汉语理解和机器翻译
4.1.6.1 汉语理解 Chinese language understanding366
GB 12200.1- 90
计算机基于语言知识和背景知识对汉语进行的分析、判断和推理。4.1.6.2机器翻译machine translationMT(缩写)用计算机将种自然语言(源语言)转换成另一种自然语言(目标语言)的过程。4.1.6.3机器调典machine dictionary以人用词典为基础,通过对词法、句法、语义等信息的规范化和形式化描述,做成的存储在计算机中的词典。
4.1.6.4源语言source language在机器翻译中,被翻译的语言。H标语言target language
4. 1.6. 5
在机器翻译中,所译成的语言。4.1.6.6句法语义分析parsing
用计算机在句法和语法层次上对句子进行分析,即主要通过语言中各种成分的句法功能和语义关系来描述句子的结构与层次。汉语分析Chinese analysis
将输入计算机的汉语句子或篇章,利用给定的分析方法,确定每个成分的词法,句法和语义等信息,并将其转换成便于计算机进一步处理的中间表示。4.1.6.8汉语生成Chincsc gcneratian从计算机中的某种语言信息的中间表示出发,通过必要的语法和语义知识转换生成汉语的句子或篇章。
4.1.7汉语信息处理设备和软件
4.1.7.1汉语语词处理机Chinese word processor一种专用的汉字信息处理系统,用于汉语文稿的输入、编辑、存储、印刷及传送。4.1.7.2多文种语词处理机multilingualword processor·种能处理两种及两种以上语言”文字信息的具有键击输入、显示、校改、文本编辑、印刷输出等功能的设备。该设备通常也具有简单的文档管理功能。例:中英文电子打字机。
汉字印字机Chinese character printer4.1.7.3
能实现中、英文输出的印字设备。通常分为击打式和非击打式两种,一般都配有中、英文字形库。
汉字终端Chinesc character terminal4.1.7.4
能完成汉字输入、输出功能的计算机终端,通常分为简易型、通用型和智能型。4. 1.7.5
汉字输人键盘Chinese character inputkeyboard便于输入汉字的专用键盘。它可分为整字型、部件(字根)型等类型。它在键位布局和结构设计等方面有别于传统的西文键盘。4.1.7.6 汉 卡 Chincsc character card将汉字编码输人方法的码表和有关程序及汉字的字模数据固化在ROM器件中的-种逻辑电路插件
4.1.7.7 汉字字形库Chinese character font library建立在计算机存储媒体上的汉字的字模数据集合。4.1.7.8
汉语调语库 Chinese word and phrase library建立在计算机存储媒体上汉语的词和短语的集合,该集合可按词语关系的结构作有序的排列,可以按收词多少、词语性质、功能、结构等分类4.1.7.9汉字公用程序Chinese charactet utility programs367
GB12200.1-90
支援计算机系统在汉字方式下实际运行的辅助程序。例:汉字造字、排序、编辑及打印等程序。4.1.7.10多文种信息处理系统multilingual information processing system能处理由多种语言“文字所表述的信息的系统。它们可分为两类:一类是在原有单文种系统基础上扩充而成的,在这类系统中新纳入的文种应用的范围往往受到限制;一类是以能容纳多种文字字符的大字符集为基础设计的系统,可不受上述限制。4.1.8汉语信息处理技术应用
4.1.8.1通用型汉字信息处理系统general-purpose Chinese character information processing system适用于各种数据处理和汉字信息处理的计算机系统。其特点是通用性强,汉字输入输出手段多,操作方便。
electronic publishing systemEPS(缩写)电子出版系统
利用以计算机为主的电子技术代替传统的人工编辑、铅字排版的自动化印刷出版系统。4.1.8.3中文情报检索系统Chinese information retrieval system对中文情报进行收集、存储、检索、加工、编辑和分发传送的信息处理系统。4.1.8.4汉语计算机辅助教学系统Chinesc computer-aided instruction system通过教员或学员与计算机之间的交互活动,辅助编辑教材,选择适于学员个人的学习程序和课程内容,达到教学汉语目的的-种信息处理系统。368
电子出版系统
多文种信息处理
多文种信息处理系统……
多文种语词处理机
繁体字
分词单位·
汉语词语编码
汉语词语库
汉语分词
汉语分析
汉语计算机辅助教学系统
汉语理解
汉语拼音(方案)
汉语生成
汉语信息处理
汉语语词处理机
汉语语音分析
汉语语音合成
汉语语音识别
汉语语音数字信号处理
汉语语音信息处理
汉语语音信息库
汉字编码
汉字编码方案
汉字编冯(键盘)输入方法
GB 12200.1--90
附录A
汉语索引
(参考件)
汉字编码输入方法评估
汉宁编码字符集
4. 1. 7,2
4. 1.3.11
汉字点阵字形
汉字公用程序
汉字(信息)交换码
汉字控制功能码
汉字内部码
汉字识别
汉字输出
汉字输入
汉字输入键盘
汉字属性
汉字属性字典
汉字信息处理
汉字印字机
汉字终端
汉字字形库
汉字字形码
机器词典
机器翻译
计算语言学
简化字。
句法·
句法语义分析
民族语言支撑能力
目标语言
普通话
人工语言
4. 1. 4.6
4. 1. 1. A
4. 1. 4. 9
4. 1. 2. 17
.4.1.3.10
4.1.2. 11
受限语言
通用型汉字信息处理系统
现代汉语
现代通用汉字
异体字
artificial language
attribute of Chinese charactersChinese
Chinese
Chinese analysis
Chinese character
Chinese charactcr attribute dictionaryChinese character card
12200.1-90
语言模型
语言信息处理
语言知识库。
4. 1. 8. 1
语言资料库·
语义·
语用·
源语言
中文情报检索系统
自然语言
附录B
英文索引
参考件)
Chinese character code for information interchangeChinese character coding ...........*...............*.*.Chinese character coding (keyboard) input methodChinese character coding scheme ......Chincse character coded character setChincse character control function codeChinese character dot matrix font -...Chincse character font code ..370)
业专电业
4. 1. 2. 10
4. 1. 2. 16
4. 1.2. 15
4. 1. 2. 12
4. 1. 3. 2
.4.1.6.7
4. 1. 3. 9
4. 1. 7. 6
Chinese character font libraryChinese character information processingChincse character input
Chinese character input keyboardChinese character internal code.Chinese character output -.....Chinese character printer
Chinese character recognitionChinese character tcrminal
中中国e
...-+.......-.
Chinese character utility programsChincse computer-aided instruction system ......Chinese generation
Chinese information processingChinese information retrieval systemChinesc language understandingChinese speech analysis
营营中
...ia..........
P+e++.-+h.
Chinese speech digital signal processingChinese speech information library心+中中
Chinese spccch information processingChinese speech recognition
Chinese speech synthesis ........Chinese word and phrase codingChinese word and phrase libraryChinese word processor
Chinese word segmenting
computational linguistics
产业专中
+eeeeo中#oee
.e+..+.-...-+-+-..+.+++.++-e.9.contemporary Chinese languagecorpus
current commonly-used Chinese characterE
electronic publishing systemcvaluation of Chinese character coding input methodG
general-purpose Chinese character information processing systemgrammar
language
e心中中心
服量烟
e+++e++-+++++*
+中--
4. 1. 1.3
4. 1. 1.4
4.1、1.7
4. 1. 5. 1
4. 1.7. 4
4. 1. 6. 1
4. 1.5. 6
4.1. 5. 5
4. 1. 3. 14
4. 1.3. 6
language information processinglanguage knowledge base
linguistic model
machine dictionary
machine translation
multilingual information processingmultilingual information processing systemmultilingual word processor
National language support
natural language
parsing
Pinyin
pragmatics
Putonghua
restricted language
scheme of the Chinese phonetic alphabetscript
semantics
simplified Chinese charactersource language
speech sound
syntax
target language
unsimplified Chinese chara
variant Chinese character
vocabulary
12200.1-—90
4. 1. 1. 1
4. 1. 1.7
4. 1. 3. 5
4. 1. 2. 13
4、1.2、4
4. 1. 2. 11
.1.2.9
word segmentation unit
附加说明:
本标准由武汉大学、中国船舶工业总公司709所、机械电子工业部4所、机械电子工业部计算机与信息发展研究中心、航天航空工业部710所、机械电子工业部计算机外部设备研究所、北京语言学院负责起草。
本标雄主要起草人张普、林东海、袁琦、赵珀璋、龚滨良、林宁。373
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。