首页 > 国家标准(GB) > GB/T 17532-1998 术语工作 计算机应用 词汇
GB/T 17532-1998

基本信息

标准号: GB/T 17532-1998

中文名称:术语工作 计算机应用 词汇

标准类别:国家标准(GB)

英文名称:Terminology work-Computer applications-Vocabulary

标准状态:已作废

发布日期:1998-01-01

实施日期:1999-06-01

作废日期:2005-12-01

出版语种:简体中文

下载格式:.rar.pdf

下载大小:690658

标准分类号

标准ICS号:综合、术语学、标准化、文献>>词汇>>01.040.01综合、术语学、标准化、文献 (词汇)

中标分类号:综合>>基础标准>>A22术语、符号

关联标准

替代情况:被GB/T 17532-2005代替

采标情况:=ISO/DIS 1087-2-2-1996

出版信息

出版社:中国标准出版社

书号:155066.1-15943

页数:23

标准价格:14.0 元

出版日期:2004-04-15

相关单位信息

首发日期:1998-11-05

复审日期:2004-10-14

起草单位:国家语言文字工作委员会

归口单位:国家语言文字工作委员会语言文字应用研究所

发布部门:国家质量技术监督局

标准简介

本标准规定了在术语工作和术语编纂中用于语言和信息处理的术语。本标准适用于术语数据库的研究、开发、维护及管理工作,在其他涉及术语数据处理的工作中也可参考使用。 GB/T 17532-1998 术语工作 计算机应用 词汇 GB/T17532-1998 标准下载解压密码:www.bzxz.net
本标准规定了在术语工作和术语编纂中用于语言和信息处理的术语。本标准适用于术语数据库的研究、开发、维护及管理工作,在其他涉及术语数据处理的工作中也可参考使用。


标准图片预览






标准内容

GB/T17532—1998
本标准等效采用ISO/DIS1087-2-21996《术语工作词汇第二部分计算机应用》。本标准根据我国的实际情况和汉语、汉字的特点,在等效采用ISO/DIS1087-2-2:1996时,主要做了以下改动:
1.根据我国术语工作标准的命名习惯,将标准名称改为《术语工作计算机应用词汇》。2.把某些术语注中的内容,直接引入到定义中,把定义中的内容改为注。3.增加了部分中文例。
4.从GB/T12200.2--1994《汉语信息处理词汇02部分:汉语和汉字》中引入了8条有关汉字字符的术语。
5.删去了附录B文献目录。
本标准是术语数据库的系列国家标准之,已经发布的配套标准有:GB/T13725--1992建立术语数据库的-般原则与方法术语与辞书条目的记录交换用磁带格式GB/T13726--1992
GB/T15387.2-1994术语数据库开发指南GB/T15387.1--1994术语数据库开发文件编制指南GB/T15625--1995术语数据库技术评价指南GB/T16785--1997术语工作概念与术语的协调GB/T15786--1997术语工作计算机应用数据类目本标雅由全国术语标准化技术委员会提出。本标准由国家语言文字工作委员会语言文字应用研究所归口。本标准由国家语言文字工作委员会、中国标准化与信息分类编码研究所、中国大百科全书出版社北京大学计算语言学研究所、中国科技信息研究所等单位起草。本标准由全国术语标准化技术委员会计算机辅助术语工作分技术委员会负责解释。本标准的附录 A和附录 B是提示的附录。本标准主要起草人:冯志伟、李莉、王渝丽、俞士汶、周智佑、宋正良、李竹等。516
GB/T17532—1998
ISO前言
国际标准化组织(ISO)是各国家标准化团体(ISO成员团体)的一个世界范围的联盟。国际标准的制定工作通常是通过ISO的技术委员会进行的,对某个已成立了技术委员会的专业领域感兴趣的成员团体都有权参加该委员会。与ISO有联系的官方和非官方的国际组织也参与这项工作。ISO在电工技术标准化方面与国际电工委员会(IEC)紧密合作。委员会所采纳的国际标准草案需分发给各成员团体投票表决,作为国际标准发布时要求至少75%的成员团体投票批准。
国际标准ISO1087-2是由ISO/TC37/SC3术语工作(原则与协调)技术委员会第3分委员会计算机辅助术语工作分委员会”制定的。作为ISO1087:1990第7章的技术修订,本标准废止并同时取代该标准的这部分。ISO1087:1990主要章节的技术修订将发展为ISO1087-1。附录A和附录B是提示性附录。
0 导言
中华人民共和国国家标准
术语工作计算机应用词汇
Terminology work--Computer applications—VocabularyGB/T 17532--1998
eqv IS0/DIs 1087-2-2:1996
本标准的条目按顺序给出,每部分设一个一一般性的标题。在通常的情况下,后面的条目原则上应该由前面出现的条目来定义。
条目的格式按GB/T1.6--1997的规定。条目的内容顺序如下:
条目编号
优先术语(黑体)
缩写形式(黑体)
许用术语
拒用术语:括号中注明“(拒用)”专业领域用尖括号>
定义引用的术语用黑体标出,并在后面用括号注明条月编号例
除了条目编号之外,优先术语和定义仅在适当的地方出现。1范围
本标准规定了在术语工作和术语编纂中用于语言和信息处理的术语。本标准适用于术语数据库的研究、开发、维护及管理工作,在其他涉及术语数据处理的工作中也可参考使用。
2引用标准
下列标准所包含的条文,通过在本标准中引用而构成为本标罹的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。GB/T12200.2-1994汉语信息处理词汇02部分:汉语和汉字GB/T12991—1991信息处理系统数据库语言SQL(idtISO/IEC9075:1989)GB/T15237-1994术语学基本词汇(neqISO1087:1990)GB/T 5271.8—1993
词汇08部分:控制、完整性和安全性(eqvIS02382-8:1986)数据处理
ISO/IEC2382-1:1993信息技术
ISO 2382-4:1987
信息处理系统
ISO 2382-6:1987
信息处理系统
ISO/IEC 2382-9:1994
ISO/IEC 2382-23:1994
信息技术
信息技术
国家质量技术监督局1998-11-05批准518
第1部分:基本术语
第4部分:数据的组织
第6部分:数据的准备和处理
第9部分:数据通信
第23部分:文本处理
1999-06~01实施
3一般概念
3.1信息information
GB/T 17532—1998
《信息处理关于客体(如事实、概念、事件、思想、过程等)的知识,它在一定的上下文中具有特定的意义。
1本条引自ISO/IEC2382-1。
2在其他的应用领域,信息的定义不同。3.2数据data
为进行通信、解释和处理而使用的信息(3.1)的形式化表现形式。注:本条改自IS0/IFC2382-1。
3.3数据处理data processing
对数据(3.2)进行的系统操作。例:对数据进行算术运算或逻辑运算,数据的归并(9.5)或分类(9.4),程序的汇编或编译,以及对文本(3.6)的操作,如文本编辑(12.3)、分类、归并、存储、检索、显示(9.6)、打印等,注:本术语不能作为信息处理(3.4)的同义术语。3.4 信息处理 information processing对信息(3.1)进行的系统操作,它包含数据处理(3.3)。注
1本条改自ISO/IEC2382-1。
2本术语不能作为数据处理(3.3)的同义术语。3.5语言处理languageprocessing对语言进行的系统操作,它包括数据处理(3.3)。3.6 文本 text
以字符(6.1)、符号、词、短语、句子、段落、表格或其他的符号序列的构成的用于表达意义的结构化数据(3.2)。其解释主要根据阅读文本的人对于某种自然语言或人工语言的知识来进行。注:本条引自IS0/IEC2382-1。
文本语料库text corpus
语料库 corpus
<自然语言处理根据预先确定的规则所准备、编码或存储的机器可读文本(参阅7.4)或文本的某些部分的有组织集合。
注:文本语料库可按专业领域、容量或时代做不同的限定,例如,从1986年以来的某些特定的期刊、数学文本等。文本语料库可用作进一步的语言分析或术语工作的原材料。3.8类型type
<自然语言处理文本(3.6)中代表一个确定类别的语言单位。注:这种语言单位通常是未用定界符(3.10)隔开的不间断的字符串。3.9类例token
<自然语言处理)类型(3.8)在文本中的具体表现形式。例:在英语中,如果把good的所有词形定义为类型,那么good,better和best等都是词形good 的类例。
3.10 定界符 delimiter
分隔符 separator
用于指明个字符串(6.13)的开始或结尾的一个或多个字符(6.1)。519
1本条引自ISO2382-4。
2空白或标点符号经常用作定界符。3.11词形word form
给定词的任何形态句法变体。
例:在英语中indicate:indicatesvisitor :visitor's.
GB/T 17532 -1998
1在屈折语中,词形经常是届折形式,例如,英语的gogoes;以及go,went.gone。2这个定义不包含正词法方面的变体。3.12词形变化范型paradigm
<自然语言处理)属于某一给定词的各个词形(3.11)的类聚。3.13 基本词形 base form
参照词形reference form
根据词典编纂学的惯例选出的用以表示--个词形变化范型(3.12)中的各个形式的词形(3.11)。例:在英语中,bind是bind,bound,binds,binding等的基本词形。注
1本条改自GB/T15237-1994。
2 术语基本词形”也可以应用于词组型术语。3.14词组型术语multi-word term包括两个以上词的术语。
压缩形 compressed form
规定形normalized form(拒用)缩减形reduced form(拒用)
经过压缩(8.4)的字符串。
例:字符串\input/output-algorithm\变成其压缩形“inputoutputalgorithm”注:术语“缩减形”和“规定形\可能会导致误解,建议避免使用这两个术语。3.16取消届折deinflection
取消词形(3.11)中的屈折成分。3.17取消屈折的词形deinflected word form在取消届折(3.16)之后余下的调段(3.18)。3.18词段word part
词片 word segment
为了某种特殊用途从一个词形(3.11)中取出的字符串(6.13)。3.19 词形还原 lemmatization
从某一给定词形(3.11)生成基本词形(3.13)的过程。例:在英语中,“go”是\goes”通过取消届折(3.16)而得到的基本词形(3.13);而\go\是\went\通过不规则动词变换得到的基本词形(3.13),这种变换不符合标准的屈折规则。注:这样的结果也称为词形还原。3. 2Q、剖析parsing
根据给定的算法,将给定的结构分解为其组成成分的操作。例:在英语句子\all unsaturated fatty acids are not degradable by biological methods\中,“allunsaturated fatty acids\和“biological methods”可看成是词组型术语(3.14),它们可以被抽取(8.9)。
GB/T17532-1998
注:剖析不一定必须提供对某一句子的完整分析。术语数据集合terminological data collection3.21
包含特定专业领域有关各种概念的信息(3.1)数据(3.2)集合。术语条目terminological entry3.22
术语数据集合(3.21)中所包含的关于~个概念的术语数据(3.2)。注:-个术语条目可以包含两个以上的记录(7.9)。3.23同形词homograph
两个以上的具有相同书写形式但表示不同的概念(语义同形)或不同句法功能(句法同形)的词形或词。
例:在英语中,lead(铅Pb)和lead(领导);bark(吠)和 bark(树皮)。
在汉语中,仪表(人的外表)和仪表(测量温度、压力等的仪器);杜鹃(布谷鸟)和杜鹃(映山红)。注:具有不同书写形式但经过压缩(8.4)之后变为同形的词形(3.11)不算同形词。3.24歧义消解disambiguation
通过赋予同形词贴切的概念或贴切的句法功能从而分化同形词(3.23)的过程,或者通过赋予同形词组以不同的语言解释来分化同形词组的过程,例:在汉语中,分化“白跑”和“白纸”中的“白”分别为副词和形容词;分化“学习文件”的句法结构分别为动宾结构和偏正结构。
4数据组织
4.1分类值
sort vaiue
排序值sorting value
根据预先确定的顺序,字符集(6.2)中某一元素的位置。例:在法语中,字母A具有比字母B较低的分类值。个小写字母是否与它相应的大写字母具有相同的分类值,取决于实际应用的需要。带发音符号的字母有时按其相应的基本字母来处理,有时按不同的学母来处理。
4.2分类关键字sort key
排序键
用于满足分类(9.4)和归并(9.5)操作要求的字符串(6.13)。例:当给图书数据分类以便产生作者目录时,作者的姓是第一分类关键字,作者的名是第二分类关键字。如果同-→个作者有两个题目,则把出版年份或题目作为附加的分类关键字。4.3字母排序alphabetical ordering在组织字符串(6.13)时,表中的每一个串(6.12)的位置唯一地由从该串(6.12)头部开始的分类值(4.1)来确定。
1带有发音符号和连音符号的字母以及带有数字、上标、下标的其他符号都可以作为特殊的分类值。2字母排序的规则可以因语言的不同而不同。逆字母排序reversealphabetical ordering4.4
在组织字符串(6.13)时,表中的每一个串(6.12)的位置唯一地由从该串(6.12)尾部开始的分类值(4.1)来确定。
4.5频度顺序frequencyorder
在特定的文本(3.6)或文本语料库(3.7)中,根据类例(3.9)出现频度上升或下降的顺序来排列的521
类型(3.8)的顺序。
GB/T 17532-—1998
注:在通常情况下,表的类型是词形(3.11)频度表或原形词频度表。4.6 轮排 permutation
使词组型术语中每个实词都作为关键词进行的排序。例:在英语中,对字符串“millions of instructions per second\[MIPs]轮排时,“instructions,mil-lions of per seconds\,\second.millions of instructions per\等形式分别出现在\instructions\和“second\等实词的排序表中,这样可以保证术语中任何想要的成分都可以出现在相应字母的排序位置。
注:本条改自GB/T15237.-1994。4.7 毗连 concatenalion
两个以上的字符串(6.13)按特定的顺序合并,形成-个新的串(6.12),其长度等于各个字符串(6.13)长度的和。
5术语数据的筛选
exclusion list
非用词表
停用词表stop word list
在数据处理(3.3)中任意选择的不予考虑的字符串(6.13)组成的表。注
1在术语工作中,产生忽略功能词(代词、冠词等)的词表可能是有益的。2有时,非用词表中的字符串可以被保留下来(例如在词语索引(5.4)中),但是不注明其频度。5.2 拟用词表inclusion list
加用词表 plus word list
要保存或认为要进一步数据处理(3.3)的字符串(6.13)组成的表。例:凡包含“bank\(银行)或“credit institution”(信用机构)的所有的句子都抽出;凡以“M\起头的所有的条目在名字索引中都检索出来;凡以“anti-\开头的所有的单词都选出来。注:如果适合的话,拟用词表也可以包含词段(3.18)或其他的字符串(6.13)。5.3自由文本搜索free-text search在文本语料库(3.7)中进行的,能够检索任何类型(3.8)的搜索(8.7)。5.4 词语索引 concordance
<自然语言处理》按字母顺序排列的词形(3.11)表,其词形(3.11)是从原文中抽取(8.9)出来的,包括要检索的词形(3.11)以及该词形(3.11)在原文中的前面部分和后面部分。注:词语索引通常的形式是KWIC(上下文关键词)词语索引和句子词语索引。5.5 索引 index
<自然语言处理>从一个出处摘出的并属于同一类数据元的有序字符串(6.13)汇集表。注:本条改自GB/T15237--1994。5.6 术语索引 term index
参照词汇或术语数据库(7.6)中的术语条目(3.22)而编制的索引(5.5)。注:术语索引中的术语可以按照字母来排序,也可以按照其他系统来排序。字母索引alphabetical index
按字母顺序排列的索引(5.5)。5.8系统索引systematic index
所有的术语排列能反映特定专业领域中概念之间的系统关系的索引(5.5)。5.9轮排索引
permuted index
GB/T 17532 --1998
按轮排(4.6)方式列出的术语索引(5.6)。逆序索引reverse index
按逆字母排序(4.4)列出的索引(5.5)。倒排索引 inverted index
列出文本(3.6)中的全部类型(3.8)以及全部对应类例(3.9)的索引[(5.5)。2 词形索引 word form index
词索引 word index
文本(3.6)中所有词形(3.11)的索引,其中在文本(3.6)中出现两次以上的词形(3.11)用-个单独的类型(3.8)来代表,并指出其出现次数(即相应的类例(3.9))以及它们的原文参照。5.13还康词索引lemmatized word index用词形(3.11)的基本词形(3.13)来代表的词形索引(5.12)。6字符
6.1字符 character
用于表示、组织或控制数据(3.2)的元素集中的成员。注
1本条引自ISO2382-4。
2字符可以分为图形字符和控制字符。字符集character set
不同字符(6.1)的有限集合,它对于一定的目的而言是完整的。例:ISO646的国际参照本,
128个ASCI字符。
注:本条引自ISO2382-4。
6.3 字母表 alphabet
按公认的线性次序排列的字母字符(6.6)集。注
1本条改自ISO2382-4。
2这个定义也覆盏了由李符(6.1)组成的自然语言的字母表,这些字符(6.1)包含带发音符号的字母。6.4 图形字符 graphic character一种具有视觉表示的,通常可以书写、印刷或显示(9.6)的字符(6.1),它不同于控制字符(6.5)。注
1本条引自 ISO 2382-4。
2图形字符可以是字母宇符(6.6)、数字(6.7)或特殊字符(6.9)。6.5 控制字符 control character在特定上下文中并实现某种控制功能的字符(6.1)。注
1本条引自ISO 2382-4。
2控制字符(6.1)启动、修改和停止数据处理(3.3)的操作。6.6 字母字符 alphabetlc character图形字符(6.4)中用于书面表示给定语言的字母。注:它包括带发音符号的字母。6.7
数字digit
数字字符numeric character
表示非负整数的字符(6.1)。
注:本条自ISO 2382-4。
GB/T 17532—1998
6.8 字母数字字符 alphanumeric character或者是字母字符(6.6),或者是数字(6.7)的任何字符(6.1)。6.9 特殊字符 special character不是字母数字字符(6.8)的图形字符(6.4)。例:任何标点符号,and符号[&],百分符号[%],加号[+]等都是特殊字符。注:本条改自IS)2382-4。
6. 10 间隔字符 space character引起打印或显示位置沿着直线向前移动一个位置的控制字符(6.5)。注:本条改自ISO)2382-4。
空白blank
在图形字符(6.4)串中表示一个空位置的字符(6.1)。注:本条引自ISO2382-4。
6.12 串 string
由具有相同性质的元素组成的作为总体来看的序列。例:字符(6.1)、二进制位或脉冲等组成的序列。注:本条改自ISO2382-4。
6.13 字符串character string
未被空白隔开的由多个字符(6.1)组成的序列。注:一个字符串常常代表一个单词。6.14 模样 pattern下载标准就来标准下载网
当用组合字符(6.1)替换某些字符(6.1)时定义的串(6.12)。注:本条参照GB/T 12991.
6. 15 汉字 Chinese character记录书面汉语的文字。
汉字字形character form
特指构成方块汉字(6.15)的二维图形。注:本条引自GB/T12200.2。
6.17  笔画 stroke
构成楷书汉字字形(6.16)的最小连笔单位。汉字最基本笔画有横(一)、竖(1)、点(、)、撇())、折(乙)等。
注:本条引自GB/T12200.2。
3笔顺strokeorder
书写每个汉字(6.15)时的笔画(6.17)的次序和方向。注:本条引自GB/T12200.2。
6.19笔数stroke count
构成一个汉字(6.15)或汉字部件(6.20)的笔画(6.17)数。注:本条引自GB/T12200.2.
6.20 汉字部件 Chinese character component由笔画(6.17)组成的具有组配汉字(6.15)功能的构字单位。现代汉字部件按是否成字可分为成字部件与非成字部件。
例:成字部件:木 心口 也
非成字部件:』
注:本条引自GB/T12200.2。
6.21 部首 indexing companentGB/T 17532 -1998
~部分可以成批构字的部件。凡含有某一部件构成的字在字典中均排列在一起,该部件作为领头单位排在开头,成为查字的依据,称为部首。部首多为形旁构成。例木(松、柏、杨、架、杏、林、相注:本条引自GB/T12200.2。
6.22偏旁Tadical
合体字的构字单位的传统称呼,旧称合体字(由两个或两个以上汉字部件构成),左为偏,右为旁,现代统称偏旁。偏旁本为独体字,在古代汉字(6.15)中偏旁一般与单独成字时形状相同,现代汉字(6.15)偏旁有一些变化,如“心”在左为“十”,“刀”在右为“』”;“火”在下为“”,左边的“埠”和右边的“邑”均作“阝”等。
注:本条引自GB/T12200.2。
7数据存储
7.1数据媒体data medium
用来记录数据(3.2)并且检索数据(3.2)的物理媒体。例:磁盘,光盘,缩微胶片。
1本条改自ISO/IEC2382-1.
2在图书和文献工作的领域,数据媒体被看作数据载体。7.2 格式 format
<数据处理>数据(3.2)预先确定的组织形式。注:格式可进一步分为输人格式、存储格式和输出格式。7.3 数据采集 data acquisition收集数据(3.2)或将数据(3.2)装入、存储在数据处理系统中的过程。7.4 机器可读数据 machine-readable data可直接装入数据处理系统的数据(3.2),简称机读数据。注:通常指磁盘、磁带和光盘中的数据,在一定环境下,采用光学字符识别(OCR)的办法,印刷物上的数据也可以被看成机器可读数据。
7.5数据库database
按照概念结构组成的数据(3.2)的集合。注:本条改自ISO/IEC2382-1。
7.6 术语数据库 terminological database包含术语数据的数据库(7.5)。7.7数据库集data bank
包含管理框架的数据库(7.5)的集合。7.8 术语库集 term bank
术语数据库集 terminological data bank含有术语数据(3.2)的数据库集(7.7)。7.9记录record
作为一个单位来对待的数据元(7.11)的集。注:本条引自ISO2382-4。
7. 10 文件 file
作为一个单位来存储或处理的命名记录(7.9)的集。525
注:本条引自ISO2382-4。
7.11 数据元 data element
GB/T 17532--1998
在一定的上下文中具有区别特征的数据(3.2)单元。注:该条改自ISO2382-4。
7.12数据字段data field
为特定的数据元(7.11)而保存在一个记录中的变长或定长的部分。7.13数据字段目录data field directory在一个记录(7.9)内的数据字段(7.12)的位置索引(5.5),包括在该记录(7.9)之内的每:个数据字段(7.12)的标号(7.16)、长度和位置。7.14数据类目data category
数据元类型data element type
关于给定数据字段(7.12)的类型说明。7.15标识符identifier
用于标识或命名个数据类目(7.14)的一个或多个字符(6.1)。注
1该条改自ISO2382-4。
2标识符的命名可表明该数据类目(7.14)的某些性质。7.16标号label
数据元(7.11)集内或附加到数据元(7.11)集上的用于标识数据(3.2)的标识符(7.15)或关键字。注:该条改自ISO2382~4。
repeatable category
7. 17可重复类目
在同-个记录(7.9)中能够出现两次以上的数据类目(7.14)。例:在多语言术语条目(3.22)中,有些记录(7.9)的某些类目可以对每一种语育都重复出现。在单语言术语条目(3.22)中,诸如同义术语、出处、上下文等类目也可以重复出现。8信息检索
8.1信息检索
information retrieval
从存储的数据(3.2)中查找信息(3.1)的行动、方法和过程。注
1本条改自ISO/IEC2382-1。
2信息检索可以在交互式处理或批处理中进行。8.2查询语言query language
<信息检索》用户用来检索或者修改存储在数据库(7.5)中数据(3.2)的数据操纵语言。8.3 截断 truncation
<信息检索>为了搜索或选择而将词形(3.11)变为词段(3.18)的过程。注:截断过程可以自动地进行,或者让用户自行选择。截断的方向可以从左向右,也可以从右向左,8.4压缩compresslon
<自然语言处理>为了数据处理(3.3)的目的,把词形(3.11)转换为简化形式的操作。注:压缩一般是指去掉发音符号,消除空白(6.11)和各种特殊字符(6.9)以及不管大小写的区别。例如,当把某些拼写变体中立化以便生成案引(5.5)时,就带要使用压缩。8.5 接索词search word
搜索关键字searchkey
<信息检索用于提供访问记录(7.9)的字符串(6.13)。526
GB/T 17532 --1998
注:搜索词可以是术语、词,字等(英语中还包括单词或者单词的一部分)。8.6词干搜索stem search
递降分析degradation
按照预先确定的规则,逐次去掉字符串(6.13)中的字符(6.1),使用自动生成的搜索词(8.5)随意提问的过程。
注;根据不同语言中构词方式的不同,其顺序可以从右到左,也可以从左到右。8.7搜索search
<信息检索》自动地检查数据(3.2)的集合,以匹配(8.8)或抽取(8.9)具有给定特性的元素。例:在姓名的集合中查出所有以J开头的姓名。8.8 匹配 match
<信息检索>通过比较来确定不同的数据(3.2)集之间项的同一性,以便选择或分离其有同-性的项。
8.9 抽取 extract
一信息检索从一组项中,选择并取出某些符合预先确定的性质的项。8.10加权ranking
<信息检索≥根据搜索响应对于相应的搜索提问的相关程度的不同,给它们指派不同权值。9数据管理
9.1 读 read
从数据媒体(7.1)获取数据(3.2),并保持数据不变。注:本条改自ISO2382-6。
9.2 写 write
将数据(3.2)长期或暂时记录在数据媒体(7.1)上。注:本条改自ISO2382-6。
9.3拷贝copy
将数据(3.2)从源数据媒体(7.1)读(9.1)出,保持源数据不变,然后写(9.2)到目标数据媒体上。例:将一个文件从硬盘上拷贝到软磁盘上。注:本条改自ISO2382-6。
9.4 分类 sort
按指定的准则将一些项分离成若干个组,对其加以排列整理的动作。注:本条改自ISO2382-6。
9.5 归井 merge
将两个以上的具有相同给定顺序的数据(3.2)的集合中的项合并成具有该顺序的一个更大的集合。
注:本条引自ISO2382-6
9.6显示display
在屏幕上对数据(3.2)进行可视的显现。9.7屏蔽码 mask
利用某一字符(6.1)模样(6.14)来控制另字符(6.1)模样(6.14)中那些要保留或者要删除的部分。
例:所有的元音a,ei,o,u都可用表示元音类别的字符V来替换。注:本条改自ISO2382-6。
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。