首页 > 国家标准(GB) > GB/T 15485-1995 声学 语言清晰度指数的计算方法
GB/T 15485-1995

基本信息

标准号: GB/T 15485-1995

中文名称:声学 语言清晰度指数的计算方法

标准类别:国家标准(GB)

英文名称:Acoustics-Methods for the calculation of the articulation index of speech

标准状态:已作废

发布日期:1995-07-03

实施日期:1996-02-01

作废日期:2018-05-01

出版语种:简体中文

下载格式:.rar.pdf

下载大小:KB

标准分类号

标准ICS号:计量学和测量、物理现象>>声学和声学测量>>17.140.01声学测量和噪声抑制综合

中标分类号:综合>>计量>>A59声学计量

关联标准

替代情况:被GB/T 12060.16-2017代替

采标情况:,

出版信息

出版社:中国标准出版社

书号:155066.1-12107

页数:平装16开, 页数:18, 字数:34千字

标准价格:13.0 元

出版日期:2006-05-04

相关单位信息

首发日期:1995-07-03

复审日期:2004-10-14

起草单位:电子工业部第三研究所

归口单位:全国声学标准化技术委员会

发布部门:国家技术监督局

主管部门:中国科学院

标准简介

本标准描述了计算清晰度指数AI的方法和步骤并给出AI与音节清晰度之间的函数关系。本标准所述的计算方法的根据是男女成年正常发音人,以汉语普通话发音和男女成年正常听音人的平均结果。本方法中的数据不适用于儿童。 GB/T 15485-1995 声学 语言清晰度指数的计算方法 GB/T15485-1995 标准下载解压密码:www.bzxz.net
本标准描述了计算清晰度指数AI的方法和步骤并给出AI与音节清晰度之间的函数关系。本标准所述的计算方法的根据是男女成年正常发音人,以汉语普通话发音和男女成年正常听音人的平均结果。本方法中的数据不适用于儿童。


标准图片预览






标准内容

中华人民共和国国家标淮
声学语言清晰度指数的计算方法Acoustics-Methods for the calculationof the articulation Index of speech1主题内容与适用范围
GB/T15485—1995
由于语言清晰度试验繁复费时、现已发展了一种与语言可懂度高度相关的可计算的物理度射,象组织一组发音人和听音人来进行言语感知试验·样的评价语吉可懂度,这个物现度量称之为清晰度指数:简称AI.A1是在给定的语通道和噪声条件下,表示对·个听音人获得语言可懂度可利用的正常语言信号的有效比率(部分),它是一个如权的分数,由测量或估计的语言额谱和在听音人耳边存在的噪声的有效掩蔽谱可计算Al.
本标描述广计算清晰度指数AI的方法和步骤并给出A1与音节清晰度之间的函数关系。本标谁所述的计算方法的根据足男女成年正常发音人,以汉语普通话发音和男女成年正常听音人的平均结果。本方法中的数据不适用于儿童。本标雅所述计算清晰度指数AI的方法,部分采用美国国家标准ANSIS3.5—1969语言清晰度指数的计算方法》。
2术语
2.1清晰度指数articulatiun indcx通过大量语言清晰度试验,导出的其有赖带可加性的用来计算给定的语言传递系统语言可谛度的一个指数。它取值在0 与1 乏间。2.2长时均方根声压谱long-termrootmean-sguare(rms)pressurespectrum语言信号的声压振幅与频率的函数关系。可采用多种方法来测量。在1/1倍额带和1/3倍频带语告分析中,对于正常连续语言,采用15的积分时间,可得到稳定的长时频谱。所测得的均方根值的数表示称为长时均方根声压,以风别于采用较短积分时间,比如-个语音的平均时长1/8$测得的均方根值.
2.3谱级spectrum level
信号在某一频率的谱级是以该频率为中心1Hz带宽内谢得的声玉级,以分贝表示,其准出压20 μPa.
当测量滤波器带宽为A(Hz>时,连续语言的声乐谱级等测得的频带声压级减去1010BA厂。2.4I/』倍频带利1/3倍频带谱octavcandone-third octavebanclspertrum当测量采用1/1倍频带或1/3倍赖带滤波器时.以分贝计的频带声压级与1/1倍频带或1/3倍频带的中心或边界频率的函数关系,称为1/1倍频带或是1/3倍频带谱。注:(一个滤被器的均方根声压级数,是指在它的几何中心或中心频率,一个滤波器带的上下截止频率是指滤波器正信号响应最大值频率上下低丁录人响应3d3处的频率。本标准要求所用滤波器衰减曲线的斜率不小于每倍频程18dB国家技术监督局1995-07-03批准1996-02-01实施
2.5语言峰值speechpeaks
GB/T15485—1995
1/8:平均时间语言信号的均方根值有百分之一超过长时平勾值12dH或更多。采用长时平可有效值加12dB作为对语言可懂度有贡献的语言峰值振幅。2.6总声级overalllevel
用C计权测得的声压级。长时总均方根声压级近似等于语音平衡闭表各个词的峰值声压级的算术半均减去3dB。测董时声级计置\通信系统传市器所在位置,要是对而交谈则胃于听音人所在位置,声级计测量时应在安静条件下,敢在慢挡和C计权。该语音平衡词时应在正常条件扩发音。2.7截幅peak clipping
当输人于一个放大器的瞬时电压,超过某-限定的线性增益值时出现的效应。2. 连续谱声音的听 t.hreshold ofaudihility for sounds having continuaus specita在安静环境采用连续谱声音逆行听力测试,50%的试验能引起听觉感受的最小信号声压级,2.9语音平·衡词试验PB(phnetically halanced)word test语音平衡阅试验使用单音节词表,每表75个音节(词).这些音节是经过精选的,它们所包含的基本语音的比例与日常口语大致是一样的,2.10频带感觉级band scnsation level频带声压级与该频带的听阐之差,以分贝来表示。3计算方法
计穿 AI 可采用下述两种片法。20赖带法:本方法基于在20个相邻的等清晰度频带(见表1)中测量或估计的语言谱级和噪声谱级。在安静环境中,语声峰值的谱级韬过听阀30dB或更多,每一频带中的语言成分对语方可懂度的页献都是相等的。
表1汉语20个等清晰度频带
渐带号
频带边界
200~400
400~550
550~730
730900
900~-1 020
1020~1150
1 750--1 270
1270~1400
1400~1 520
15201 700
1700~1900
」 900-~2 [00
2100~2 400
2 400-~2 700
27003000
带宽度
中心题率
GB/T 15485--1995
续表1
颗带边界
3000~3400
3400-4000
4 000---4 700
4 700-~6 700
5 700~7 000
频带宽度
中心振率
1/3和1/1倍频带法:它足由20频带法导出的,只是要求测量或估计语言和噪声是在1/3或整个倍频带。
下面数节将详述用上列方法计算A1。与计算有关的幽数-理想语言谱,听阅,不载极语言的最大允许声级,在1和表5中给出,这些函数的根据是:汉语标准频讲和国家标准:GB4983自由场纯普称准等响曲线。表6中对于1么dR和24d的截幅语言的最大容许声级的曲线分别在不截幅语言的最大容许声级之上和1参照图1)。
②1/1倍顾带法对语言和赚声谱的变化不如20频带法和1/3信频带法灵敏,因而也不精确。当掩蔽噪声的能量明显巢中在一个倍节或更窄的范函内时,1/1 倍频带法不可使用。这时应采用 1/3 体频带泌,最好采用20频带法。
(③在文献中报皆结果时.一定要说明所使用的AI计算方法,即AI(20频带),AI<1/3倍懒带>或AI(1/1培期带),
3.120频带法
3. 1.1步骤1
在计算图(见图1)上绘出已知的或估计的听音人耳处的语言峰值谱级。语言峰值谱级可用下列诸项代数和方法近似得到。3.1.1.1所评定的系统的频率响应,以分贝计。每一-频率的频响是听育人耳处的声压级与发音人在传声器处在该频率上的声级之差,以分贝计。注;必须注意保证频率响应完全反映龄个系统的发送和接收换能器的特性。3.1.1.2理想化语言频谱的确追
a。图1理想化频谱是在长时总均方根声压级为65dB时测得的。当测得的或估计的长时总均方根声压级与65dB不同时,按两者的差值上下移动曲线。注:图1中理想化频谱严格应用在距发育人屑部1m远基本上无混响和无噪声的环境中,在这些条件下,企发音人后前2.54m到1m之间测垦语言频谱吋,这个频谱的形状都相当精确。因此,语言级可在靠近发音人感部处测量(或估计),所碍数值可依平方友比定律换算成」处的值,并且假定一个等效点声源是在效音人唇后0. 6 cm处。这个导出值就可以与65 dB来比较,以得出理想化语言频率谱级所需的调整值。b.当语言是在--非消声室,非自由声场中以扬声器放声时要按表2进行校止。表2对混响或平混响房间中的扬声器所放出的语言声级的校正语言总声级,d
应从语诗声级中减去的枚正量,dB0
语音总声级.P
GB/T 15485---1995
续表2
应从语言声级中减去的校正缺d
江:丧2中给出的校正值不适用于语言通过耳机放声或在自由声场中以扬由器政岗。这个校正值足根据实验得到的,它表明在这种情况下,语言声级的提高会引起可懂度降低。例如,假定在-一混响房间中,扩声系统的长时语言总声级为 95 dB,就要问经过按 3. 1. 1. 1条所述系统频率响应特性校正的理想化谱含赖谱加上 26 dIB,即 95 dB-65 dB-4 dB(表 2校正值)。从而得出这个抑声系统的看效语谱。
3.1.2步骤2
把到达听音人再处的稳态噪声校正谱级到图1上。几种噪声源,例如,听音人所在的环境噪声和通过语言传递系统到达听音人的噪声,均方根声压要加在一一起。3.1.2.1校正嘲声谱
当噪声的频带感觉级超过80dI3时,噪声掩蔽的有效性要比正常比率增加得史快。在AI计算中这种增加的擦蔽可对噪声声压级增加一个校止量来加以考虑。一噪声感觉级在个颗带的[心频率上(图1中的那些垂直线>超过80dB,则在这-点上的噪声声压级便按表3所给的数值增加个适当的,
噪声感觉级可中噪声谱级碱去听力阀限谱级来确定,表3对掩蔽非线性增长的饺正量
频带感觉级.dE
3.1.3步骤3
应加到噪声声正级的校止置13
在计算图(图1)上绘出噪声有效掩蔽谱级。在任一频率上的有效掩胺谱是由噪声谱、校正噪声谱或GB/T 15485—1995
者在该颖率上的延伸掩蔽噪声谱中的最大的一个来决定。掩蔽噪声谱的延伸由下述方法画山来,3.1.3.1首先确定噪声掩蔽谱延伸,在最右边纵轴上找出比噪声谱或校正噪声谱的每个最大值低3dB的点,再由最高的点作水平线与噪声谱相交。这些点称为“起始点”。注:①噪声谱只有一个最大或峰值的时候那就只有一个起始点,②要是噪声谱在?000Hz或更高频率有峰值,则起始点就定在比5700Hz低3αB处。3.1.3.2从每一个起始点垂直下降57dB,再以10dB/oc1的上升斜率向左回:直线,这直线便是掩蔽谱的低频部分。Www.bzxZ.net
3.1.3.3从每一个起始点向右水平线到定长度后再以一定斜率下降。水平部分的长度与下降的斜率、每个起始点所在的频率以及在该频率上的噪声最大谱级,见表1。这些条线代表延伸拖蔽谱的高频部分。
男女也平均21个等清晰度频借+心拨中(见衣!)14
懒带号1
5 il i2
频率Hz
图120频带法AI计算图
1最人容许声级:a语言峰值截幅24dB;-语言蜂值截幅12dB:
不截幅语言
比上述曲线高的语言峰值对语言可懒度尤克献。汉语普通话理想化语言频谱
男女声
长时谱(rmg)+12 dB(长时 rm总声级为 65 dI3),连续谱声音的听阀谱级。
巢声最大谱级或
校正后的谱级,
用其中较高者
(基雅声压 20 μPa)
76--85
56--65
GB/T15485--1995
掩蔽谱的高颊段
掩蔽的上延伸
50--B00 Hz
800-1 600 Hz
注:1)A从起始点向右画水平线的题率(Hz)数;2)B从永平线右增点往下画斜线的斜率(dB/oct):3)起始点频率值的确定馨见3.1.3条。1 600--2 400 Hz
2 400~3200 Hz 3 200 Hz~7 000 HzB
3.1.4步骤4
在20频带每个频带的中心频率均指示在图1上.,确定出语言谱级和有效掩蔽谱级的分贝差值。当差值为0或小F0时就定其为0,当语言谱级超出有效掩蔽谐级30dH时,就定其为30。注:(①)在计算图(图1)上听阅曲线高于有效掩酸谐的部分就当作最小噪声谱。②当讲言峰值曲线超出图1中所标的最大客许声级时,则最大容许声级就作为语言峰值声级。3.1.5步骤5
将在步骤4中所求得的20个差值加起来除以600,所得到的数值便是给定通讯系统在噪声条件和对所给定语言声级下的清晰度指数。3.1.6举例
用20频带法计算AI的一个说明性的例子示于图2。P
GB/T 15485—1995
明女声平均20个等清度频带中心频率(见表1)数带号
45678910121416
纳率 Hz
图 220 频带法计算 AI示例
语言峰值谱级--长时频谱(rms)-12BA
(长时 rm1s 总声级 95 dB).
骤声谱级(总声级 113 dB)。
心噪南掩蔽级(见表3) ;
a掩敲向上延伸,
b 掩蔽向下延伸。
3.211倍频带法和173倍频带法
3.2.1步骤1
根据所用的带通滤波器测定山到达听音人耳处的语言声压级。注;1/3 倍频带和 1/1 倍爆带滤波器的中心频率在丧5 中给出。语言峰值的频带声压级可用下列数值的代数和来近似:频带号
语言峰值与噪声或听阀掩蔽的差17
频常号
图24B中心顺率处读值与A1计算
GB/T 15485--1995
语吾峰值与嘲声或听阈掩蔽的差26
A1 -- 239/600=0. 40
3.2.1.1被评价系统以分贝表示的频率响应特性,在每-中心频率处的频率响应是听音人耳处的赖带声压级与在发音人传声器处该频率的声压级之差(应注意保证频率响应要完全反映整个系统的发送和接收换能器的特性)。
3.2.1.2计算理想化语言频谱
a-按着测得的或估计的语言长时总声级(rms)与65dR之差来移动理想语频谐,即在表5中相应的频带的理想化语言赖谱数值加或减去这一差值,h。在-个非白由市场或非消声室中以扬声器放声时,语言长时总声级要按表2指示的数值来降低(表2中给出的校正值不适用于通过耳机吴现语言或在自由声场中使用场声器放声)。注:表5中的理想化语言频谱严格地适用在基本上无混响无噪声环境中距离发音人唇部1加处。3.2.2步骤2
计算山到达听音人耳处的稳态噪声的频带声级。从儿个声源,例如,听音人所在的环境噪和通过语言传递系统到达听音人处的声,其有效声能要加在一起,注:当在一个对可懂度有贡就内烈带的中心频率上1/1倍频带或1/3倍额带的感觉级超过84dR时,语言和噪声赖谱就要变换成谱级的值(见2.3条),并将其结果画到图1上.这样就要采用3.1.1到3.1.5条所述的20频带法来计算AI。变换成谱级的日的尼为了能在计算AI时者虑判非线性和延神掩敲效应,这种延伸境蔽效应在频带感觉级超过84dB时就变得品著。GB/T15485—1995
表5理想化谱言额谱十12B、有效听阈频谱和对连续谱声音不截幅语言的最大容许声压级20个等清晰度频带中心赖率的
中心频来
48. 0 -16. 0 105
—16. 0 103
43: 0 -16. 0 101
39. 0—17.
37. 0—17. 5
36. 0—19. 0
34. 0--20. 0
32. 022. 0
H0. 0—24. 0
28.0—26. 0
26.0 28.5 99
24. 0 —29. 0
22.0 : 30.0 99
30,0100
16. 5-29. 0 102
1/3倍斓带中心频率
频带声压级
中心频率
:为理想化语言频谱!B;
的让权值、
3.2. 3步 3
1380, 000 4
1350, 001 0
1320.001 0
1290. 001 4
130U.003 4
1320.002 4
1350.0020
1/1倍频带中心频率
凝带声压级
中心率
74.0.14.0
62. 010, 0
1400.002 4
B为有效听阅赖谱:C为连续谱不截幅语言的最大容许点级:W为计算A1计算每频带的中心率上语言择值频带声压级与噪声的癫带声乐级的分贝差值(D)。要是这一差值为0或小于0,就定差值是0。要是语言频带声压级超出噪声频带声压级301H或史多,则定此差值为30
注:()当听阀曲线超过噪声频带级的地方就把听阅当作最小等效噪声频带级。语言峰值超出最大穿许声缴的地方,最大容许声级就作为语言峰值声级。3.2.4步骤 4
CB/T 15485—1995
根据表5W列所列计权值(W)与3.2.3条步骤3中得到的差值(D)相乘。3.2.5步骤5
将DXW的数值相加。得数便是这-语言系统在给定的噪声条件和指明的语言声级下工作的AI。4各种因素对AI 的影响
4.1AI所评价的因素
语言清晰度试验得分受施加于所传递的语言信号上的诸多条件的影响,至今仍不完全清楚也不能完全定基。然而,在运用A1原理时,有一些因素是可以定量估计的:它或是个别出现或是结合在一起,除下述4.2条以外。这些因素如下。4.1.1稳态噪声掩蔽
AI可预测宽带连续噪声的影响,以及频率范圈在200~7000Hz频带宽度大于200Hx的噪声的影啊。
4.1.2非稳态噪声掩蔽
非稳态噪声对语言可懂度只在一部分时间内有影响称为作用周期。点噪声不是稳态的并且起-止作用周期是已知的,可以把噪声当作是稳态的来计算,以后应用图3对所得到的A1值加以校正就可得到有效的AI值。这种方法只适用丁噪声在作用周期中起始期的噪声级高于停止作用时期20dB以上的情说
4.1.2.1噪声中断率
对:有着确定的起-止作用周期的噪声的通讯系统,按期4.1.2条和图3的方法算出的有效A1,还要进一步根据图4中所给的函数来做调整,图4上横坐标是噪声的每秒中断次数,纵坐标是在给定参数下的有效AI
4.1.3语言信号的频率变
频畸变是信号传递时对不同频率的增益不相等,它对语音可度也是有影响的。这些影响利用AI可以考虑得相当精确。计算AI时对下列因素给以不同的侧重。a:语言信号的高成分:
b.低频成分:
C,中赖成分。
可是,要是语言信号的长时频谱很不规则,也就是频谱有一系列峰和谷,平均的峰谷斜率超过18dB/oct时,AI对语言可懂度的帖计就不太可靠了。4.1.4语方倍导的振幅畸变
计算的AI可以估计明显的对称截幅对语言可懂度的影响,可采用下列步骤。4. 1.4. 1 步骤 1
由图5来确定出一特定的截幅值和在一个系统中截幅后的放大量所造成的语言长时均力根声级的提商。
CB/T 15485—1995
u.1 n.2 0.a n.4 u.a 0. 6 o.7 0.8 .9 1.(1加上噪产的时间比率
图8对不同噪声持续因数的校正
注:纵坐标表示对不同操声时间分数按照稳态噪声掩蔽所得到的AI值应加的修正量A1修正值不能超过1.0。].[H
每球中断改数
10,IGH
图4有效AI与中断懒率的关系(从图3读AI校正量)注:滋图衣示有效入I值与掩龄哦声中断次数的关系曲线上的系数是对稳态噪声掩蔽计算所得的AI值按图3对噪声片续时闻于以修正后的结策。4.1.4.2步骤2
将步骤1的结果加到语峰值声级(非截幅语言的长时均方根+12dB)这便是听音人耳处非截幅语言和截后放大语言的声级,
注;献后故大定义为对通恰系统所如的放大量,使得峰-峰振幅达到与非截幅语言的报橘相等。讲言的峰值握操GB/T 15485—1995
定义为有百分之一时间超过的振幅。如果截幅后放大,以分贝计,不等于对谐言信号所加的截幅值,在步骤1中得出的长时均方根值的提高盘就要降低一个量。这个量等于峰值裁幅与载幅后放大量之差,4.1.4.3步骤3
将步骤2的结果绘于AI计算图上,依次按照以前所述计算AI。注意AI计算图上:的最大容许声级对于截幅语言要比非截幅语言高。注:“-般来说,峰值碰幅仅当讲言信号在懿幅前相对地设有噪声而在收听处有噪声或者在截幅后有噪声混入时才使用。
4.1.5灌响
房间中的混响将造成语言可懂度降低。降低的程度与房间的混响时问有关。混响时间定义为声源停止后一个稳您声降低60dB所需的时间。当混响时间已知时,可利用图6来校正对一个给定通讯系统求得的AI这个校正量要加到由表2修正后所得到的AI值上。
4.1.6说话声级
一个说话人声级很弱或很强都将降低语古可懂度。在其他因素保持不变的情况下,要是说话声级平稳保持在50dH到85dB(距说活人唇部1m远测得长时均方根声压级)之间,一个给定的AI值可以是精确的。要是通讯系统中使用很弱或很强的说适声级,在AI计算图上就得间出有效声级而不是测得的语言声级。实际语言声级和有效语言声级之间的关系示于图7。4.1.7视觉线索
由观察说话人的效屑和面部而得到的视觉线索对语言可懂度有很大帮助,特别是在有噪声存在的时候。可是,可以变或调--个AI使之成为一个“有效AI”以反映一般没受过\唇读”技术训练的听话人的视觉线索对语言可懂度的影响(见图8)。4.2A1不能估计的因素
有不少影响语言通讯系统的因素在现行的AI中不能估计,特别是下述几项。4.2.1说话人性别
如前所述本方法是根据男女发音人进行清晰度试验的平均结果而设计的。因而,当个别男或女说话人使用语言通讯系统时的语言可懂度可能与估计值略有出入。4.2.2多传递通道
听话人从说话人直接接收的与同时还从一个场声器接收的混合语言信号对语言可懂度的定量影响还不清楚。因而,Al可能不适用于这种系统。4.2.3多因素组合
当几种失真综合出现,如截幅、加中断噪声、加混响.月前还没有充分试验足以说明在可能的因素组合时,确切 AI 值应如何。
4.2.4非对称截幅,频率偏移和哀落本标准只适用」通讯系统的非对称截幅不超过3dB,信号的频率偏移不超过50Hz,并且没有明显的衰落变化”
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。