GY/T 262-2012

基本信息

标准号： GY/T 262-2012

中文名称：节目响度和真峰值音频电平测量算法

标准类别：广播电影电视行业标准(GY)

标准状态：现行

出版语种：简体中文

下载格式：.zip .pdf

下载大小：594921

相关标签：节目峰值音频测量算法

标准分类号

关联标准

出版信息

标准简介

GY/T 262-2012.Algorithms to measure audio programme loudness and true-peak audio level.
GY/T 262规定了一至五个声道节目音频的响度客观测量算法以及音频信号真峰值电平的测量算法。
GY/T 262适用于在电视节目或广播节目的收录、制作、交换、传送和监测环节,对节目响度和真峰值电平的测量，也适用于响度和真峰值测量仪表的研究和开发。
2术语和定义
下列术语和定义适用于本标准。
2.1绝对响度单位LKFS absolute loudness unit (LKFS)使用符合本标准响度算法计算出的响度值的单位，以LKFS标示。其中，“K" 表示测量中使用的频率加权，具体频率加权算法见第3章。LKFS表示“K加权下相对于标称满刻度的响度”。
2.2真峰值电平true-peak level信号在连续时域中的最大峰值电平,是相对于离散采样点的最大峰值电平而言的。信号的真峰值电平可能大于在采样时刻获得的最大离散采样点的峰值电平。
2.3RLB加权revised low -fr equency B- cur ve we ight ing对音频噪声电平测量中B加权曲线进行修改形成的加权曲线，具体频率响应见第3章。
3多声道响度客观测量算法
本章定义了多声道响度客观测量模型化算法，该算法包含四个阶段:
一“K” 频率加权:
一各声道能量均方值计算:
-声道加权求和(环绕声道的权重较高，且不包括LFE声道) ;
一在一个响度测量周期内，以400ms采样块组成的滑动窗口为单位(相邻窗口75%时间重叠)对响度测量值进行两步阈值处理:
第一步处理的阅值为-70LKFS;
第二步处理的阅值为经过第一步阈值处理后测得的响度值减去10dB。
多声道响度客观测量算法处理流程见图1。为便于算法描述，对图1中的流程节点设置了标签。图1

标准图片预览

标准内容

中华人民共和国广播电影电视行业标准GY/T262—2012
节目响度和真峰值音频电平测量算法Algorithms to measure audio programme loudness and true-peak audio level(ITU BS.1770-2:2011,IDT)
2012-08-07发布
国家广播电影电视总局
2012-08-07实施
引言，
范围：
2术语和定义
多声道响度客观测量算法
真峰值电平测量算法
.........
附录A（资料性附录）多声道响度测量算法描述次
附录B（资料性附录）关于准确测量数字音频信号峰值电平的考虑事项GY/T262—2012
GY/T262—2012
本标准按照GB/T1.1-2009给出的规则起草。本标准使用翻译法等同采用ITU-RBS.1770-2:2011《节目响度和真峰值音频电平测量算法》。本标准由全国广播电影电视标准化技术委员会（SAC/TC239）归口。本标准起草单位：国家广播电影电视总局广播电视规划院。本标准主要起草人：张建东、邓向冬、崔俊生、覃毅力、宁金辉、韦安明、董文辉。II
考虑到：
现代数字音频技术支持传输动态范围非常大的音频节目：a）
GY/T262—2012
现代数字音频节目制作和传输技术支持单声道、立体声和多声道格式的混合应用，因此以这三b)
种格式制作的声音节目并存：
受众希望不同来源和不同类型的节目声音在主观响度上保持一致；d)
音频电平的测量方法有很多，但在节目制作中，现有测量方法不能提供主观响度指示：为在节目交换中实施响度控制，提高受众满意度，有必要规定一个唯一的节目主观响度的客观测量算法；
将来基于心理声学模型的复杂算法，可能为多种多样的音频节目提供与主观感觉更一致的响度客观测量：Www.bzxZ.net
应避免数字媒体在记录中突然出现的过载，即便是瞬时的过载。进一步考虑到：
通用的音频信号处理，如滤波处理或者比特率压缩，可能导致信号峰值电平的增加；由于信号的真峰值可能出现在两个采样点之间，现有的测量技术没有反映出包含在数字信号中的真峰值电平；
目前的数字信号处理技术，使得实现一种算法来近似地估算信号的真峰值电平成为可能：使用真峰值算法可以准确地指示出数字音频信号的峰值电平和削波电平之间的余量：广播电视有使用指示节目响度和真峰值电平的仪表的需求。建议：
a）为利于节目传送和交换而有必要对音频通道或节目的响度进行客观测量时，应采用本标准第3章规定的算法：
在节目制作和后期制作中用来测量节目响度的方法，可以本标准第3章规定的算法为基础；当需要指示数字音频信号的真峰值电平时，测量算法应基于本标准第4章的规定，或者其他能c）
给出类似或更准确测量结果的方法。进一步建议：
a）进一步扩展第3章定义的算法，以适应对短期响度的测量；b)
如果证实新的响度测量算法的性能明显优于第3章规定的算法性能，可考虑更新本标准。III
1范围
节目响度和真峰值音频电平测量算法GY/T262—2012
本标准规定了一至五个声道节目音频的响度客观测量算法以及音频信号真峰值电平的测量算法本标准适用于在电视节目或广播节目的收录、制作、交换、传送和监测环节，对节目响度和真峰值电平的测量，也适用于响度和真峰值测量仪表的研究和开发。术语和定义
下列术语和定义适用于本标准。2.1
绝对响度单位LKFSabsoluteloudnessunit（LKFS）使用符合本标准响度算法计算出的响度值的单位，以LKFS标示。其中，“K”表示测量中使用的频率加权，具体频率加权算法见第3章。LKFS表示“K加权下相对于标称满刻度的响度”。2.2
真峰值电平true-peaklevel
信号在连续时域中的最大峰值电平，是相对于离散采样点的最大峰值电平而言的。信号的真峰值电平可能大于在采样时刻获得的最大离散采样点的峰值电平。2.3
RLB加权revised low-frequencyB-curveweighting对音频噪声电平测量中B加权曲线进行修改形成的加权曲线，具体频率响应见第3章。3多声道响度客观测量算法
本章定义了多声道响度客观测量模型化算法，该算法包含四个阶段：一“K”频率加权；
一各声道能量均方值计算：
声道加权求和（环绕声道的权重较高，且不包括LFE声道）：在一个响度测量周期内，以400ms采样块组成的滑动窗口为单位（相邻窗口75%时间重叠）对响度测量值进行两步阅值处理：。第一步处理的阈值为-7OLKFS：。第二步处理的阈值为经过第一步阈值处理后测得的响度值减去10dB。多声道响度客观测量算法处理流程见图1。为便于算法描述，对图1中的流程节点设置了标签。图1显示了五个主要声道的输入（左、中、右、左环绕和右环绕），算法允许监测包含一至五个音频声道，对于少于五个声道的节目，一些输入可以不使用。本算法不对低频效果（LFE）声道进行测量。1
GY/T262—2012
K-游液器
K滤波器
K鸿淡能
鸿波器
K鸿波器s
图1多声道响度客观测量算法处理流程框图闵
测吕的
响疫俏
算法的第一阶段是对信号进行两级预滤波，第一级用于考虑头部的声学效果，这里头部被建模为一个严格的球体。用于考虑头部声学效果的第一级预滤波滤波器的频率响应见图2。10
+--+-+--
频率(Hz)
图2用于考虑头部声学效果的第一级预滤波滤波器的频率响应考虑头部声学效果的第一级预滤波滤波器的信号流程见图3。滤波器系数见表1。图3一个二阶滤波器的信号处理流程2
-1.69065929318241
第一级预滤波滤波器系数
0.73248077421585
1.53512485958697
-2.69169618940638
GY/T262—-2012
1.19839281085285
表1规定的滤波器系数是针对采样率为48kHz音频信号的，针对其他采样率的音频信号则需要不同的滤波器系数，以使滤波器的频率响应符合图2所示的频率响应曲线。在算法的实际实现中，可能由于硬件支持的精度不够，需要对表1中的系数值进行量化。经过测试表明，本算法的性能对系数的微小变化不敏感。
第二级预滤波是应用RLB加权曲线，通过一个简单的高通滤波器实现。RLB加权二阶滤波器的信号流程见图3，频率响应曲线见图4，RLB加权滤波器系数见表2。5
-1.99004745483398
频率(Hz)
图4第二级预滤波一RLB加权滤波器的频率响应曲线表2第二级预滤波一RLB加权滤波器系数a2
0.99007225036621
表2规定的滤波器系数是针对采样率为48kHz音频信号的，针对其他采样率的音频信号则需要不同的滤波器系数，以使滤波器的频率响应符合图4所示的频率响应曲线，对预滤波后的信号计算测量周期T内的能量均方值Zt，计算公式见式（1）。1
式中：
对输入信号预滤波后的值：
iel，I=L，R，C，Ls，Rs，为输入声道的集合。(1)
GY/T2622012
测量周期T内的响度L，的定义见式（2）L,=0.691+10logloZG,·z
式中：
G—各个声道的加权系数。
为使测量响度值与主观响度更加接近，需对按照式（2）测量出的响度值进行阈值处理。将测量周期T分为一系列交互重叠的滑动窗口，窗口长度T=400mS，窗口内的一组连续音频采样值组成采样块，各个采样块应有75%的时间重叠。测量周期T的末端应限制在最后一个完整采样块的结尾，即测量周期结束端对应的不完整的采样块不予使用。
在测量周期T内，第1个输入声道的第采样块能量均方值Z.的计算见式（3）。1
式中：
step=1-重叠率：（重叠率=75%）：je3o,1,2,
Tstepl
Tg(j-step+1)
Tgj-step
第个采样块的响度1的定义见式（4）。1,=-0.691+10logio2
对于阅值工，存在一个集合J=（：1>I），集合中的元素为采样块响度值高于阈值的采样块在测量周期T内的索引，
表示集合J中元素的个数。
响度测量周期T内，进行阀值处理后的响度Lc的定义见式（5）ZG
LkG=-0.691+10loglo
测量算法的阈值处理分为两步，第一步为绝对阅值处理，第二步为相对阈值处理。相对阅值工，通过式（6）计算，其中，「为绝对阈值，「=-70LKFS。F,=10g691+10
式中：
J =j:l,>r
用，按公式（5）计算阅值处理后的响度值。式中：
GY/T262—2012
测量中使用的频率加权，由预滤波器（补偿头部声学效果的第一级滤波器和RLB加权第二级滤波器的级联）产生，命名为“K”加权。由式（2）计算出的响度值应以“LKFS”为单位，“LKFS”表示“K加权下相对于标称满刻度的响度”。信号电平每增加1dB，将导致响度值读数增加1LKFS，从这个意义上来讲，LKFS单位与dB相当。
如果将一个0dBFS的1kHz正弦波信号分别输入到左声道、中置声道或右声道，则对应的响度指示值均为-3.01LKFS
音频信号各个声道的加权系数见表3。表3音频信号各个声道加权系数
左(G)
右（G)
中置(G)
左环绕（G）
右环绕（Gz）
有关多声道响度测量算法更详细地描述，参见附录A。加权，G
1. 0(odB)
1.41(~+1.5dB)
1.41(~+1.5dB）
应该注意到：本标准规定的算法对于典型的广播内容的音频节目的响度估算有效，但是通常不适用于估算纯音信号的主观响度。
4真峰值电平测量算法
本章描述了一种单声道线性PCM数字音频信号真峰值电平的估算算法，以下算法描述以48kHz采样率为例。真峰值电平是指信号波形在连续时域中的最大值（正值或负值），该数值可能大于以48kHz采样率采样获得的最大采样值
考虑到实际应用中，测量点下游的一些处理设备有可能对原信号滤除直流分量，因此，本算法不仅可以估算原信号的真峰值电平，而且还包含了一个可选项，用来估算原信号滤除直流分量后的真峰值电平：本算法的另一个可选项是轻微的高频预加重，这样做是考虑下游信号处理环节（例如奈奎斯特滤波器）的相移可能引起高频信号峰值加大。预加重选项使算法估算出的高频信号峰值电平高于实际值，从而进一步防止在下游的处理环节中产生削波4.1概述
处理步骤如下：
a）衰减：12.04dB的衰减：
4倍过采样：
加重（可选）：预加重搁架式滤波器，零点为14.1kHz，极点为20kHz：隔直流（可选）；
取绝对值：
f）取最大值：最大值检测，若包含隔直流处理步骤则包含本步骤。隔直流前后信号的绝对值检测结果可用于估算信号在当前测量点的真峰值电平，也可用于估算在下游设备滤除直流分量的情况下信号的真峰值电平。5
GY/T262—2012
4.2框图
信号真峰值电平测量算法框图见图5输人
4.3说明
4x过采样
(荷选)
......
隔直流
图5信号真峰值电平测量算法框图绝对值
最大值
绝对值
输出1
→输出2
真峰值电平测量算法的第一步为对输入信号进行12.04dB的衰减（采样值右移2位）。信号衰减的目的是为采用整型运算的后续信号处理提供裕量。如果采用浮点计算，则无需本步。4倍过采样滤波器将信号采样率从48kHz增加到192kHz。应用更高采样率得到的信号样本能够更准确地表示信号的真实波形。高采样率和高过采样比有助于准确估算信号的真峰值电平，具体参见附录B。如果输入信号本身是高采样，则可相应降低过采样比（例如，对于采样率为96kHz的输入信号，2倍过采样比则可达到较高的测量精度）。考虑到音频信号处理中经常应用奈奎斯特滤波器，而滤波器产生的离散（相移）效应使测量和控制信号高频分量的峰值更加困难，在算法中选用预加重滤波器可提升信号的高频分量，使测量出的真峰值稍高于信号的实际峰值。
考虑到存在信号高度不对称或者信号中包含直流偏置的情况，算法除了可以测量当前测量点信号（包括非对称和/或含有直流偏置的信号）的真峰值电平，在算法中选用隔直流滤波器，还可以测量下游设备滤除直流分量后信号的真峰值电平。取绝对值处理步骤对负的采样值取反得到采样的绝对值，即负值用相同幅度的正值代替。该步骤的输出信号是单极性的。如果不采用隔直流选件，输出数据流来自输出1：如果采用了隔直流选件，“取最大值”模块针对同一个采样点选择来自两个信号路径的较大采样值，输出数据流取自输出2。后续的处理模块可将输出采样值与标称100%峰值信号电平（如果在输入端已经采用了12dB的衰减则为满刻度的1/4）进行比较，产生相对于数字满刻度的真峰值电平测量值，本标准不对这些后续处理的实现进行规定。
遵循本真峰值电平算法且至少采用192kHz过采样率的真峰值表，应以“dBTP”为单位标识测量结果。该标识表示相对于100%满刻度的真峰值电平值。附录A
（资料性附录）
多声道响度测量算法描述
GY/T262—2012
本附录描述了一个用于测量音频信号主观响度的客观算法。该算法能够准确测量单声道、立体声和多声道音频信号的响度。本算法的一个主要优势在于其简单性，可以很低的成本实现。本附录还描述了正式主观测试的结果，由此形成的数据库可用于评估客观响度测量算法的性能。A.1概述
在许多应用中需要测量和控制音频信号的响度。此类应用包括：在电视和无线电广播中，音频节目的类型和内容经常发生变化，在音乐、语音和声效或者这些类型的某些组合之间频繁地切换，这种节自内容的变化可能导致主观响度的显著改变：此外，对信号的各种动态处理也可能导致主观响度的明显改变。当然，主观响度对音乐产业也有重要意义，音乐录音中通常采用动态处理使录音节自的响度最大化。近年来，无线电通信工作小组6P一直致力于为广播应用中的典型节目确定一种主观响度的客观测量算法。在工作的第一阶段，ITU-R专门对单声道信号的客观响度算法进行了评价，结果发现：一种加权的均方测量算法Leq(RLB)对单声道信号的测量性能最佳。进一步而言，广播应用需要能够测量单声道、立体声和多声道信号响度的仪表。本标准建议了一种新的响度测量算法，成功应用于单声道、立体声和多声道音频信号。新的多声道算法以Leq(RLB)算法的直接扩展作为基础，并保留了单声道Leq(RLB)算法的极低计算复杂度。A.2背景
在研究的第一阶段，ITU-R开发了一种主观测试方法，用于测试典型单声道节目素材的响度。并在全世界五个地点进行了主观测试，建立了主观测试结果数据库，可用于评估未来响度客观测量算法的性能。主观测试方法为：评价员通过调整重放增益将各种单声道音频序列的响度和一个参考序列的响度相匹配。音频序列取自实际的电视和广播素材。同时，七家支持单位提交了总计十个单声道响度仪表/算法，在加拿大通信研究中心的音频感知实验室进行评价。
此外，还有另外两个基本响度算法作为性能对比的基础。一种测量算法Leq(RLB)，包括一个简单的频率加权函数和其后的一个均方测量单元，加权函数是被称为RLB（修正低频B曲线）的一种高通频率加权曲线；另一种测量算法Leq，仅为无加权的均方值测量。图A.1所示的是ITU-R对单声道序列，使用Leq(RLB)响度表的测量结果和主观测试结果的对比。图中，横轴表示的是来自主观数据库的相对主观响度，纵轴表示的是由Leq(RLB)算法客观测量的响度。图中每一个点代表一个音频序列的测试结果。圆圈代表基于语音的音频序列，星号代表非语音序列。可以看出数据点紧紧地聚集在对角线周围，表明Leq（RLB）算法性能良好GY/T262—2012
主观增益（B）
图A.1单声道Leq(RLB)响度表客观测量结果对比主观结果（r=0.982）评估结果发现：在所有被评估的响度仪表中，Leg(RLB）的性能最好（尽管从统计意义上，某些基于心理声学的响度测量算法同样性能良好）；Leq表现的性能几乎和RLB一样好。评估结果说明对于典型的单声道广播素材，基于能量的简单算法，与更加复杂的可能包含详细感知模型的算法相比，效果同样不错。
Leq(RLB)算法设计
Leg(RLB)响度算法被特意设计得非常简单。Leg(RLB)算法框图见图A.2，它由一个高通滤波器和一个求一段时间内能量均值的处理单元组成。即信号先经过滤波器，滤波器的输出再进入处理单元，由处理单元进行求和并计算一段时间内的平均值。滤波器的目的是根据人耳的感觉特性对信号频谱进行加权。响度测量算法采用这种基本结构的优势为：所有的处理均在简单的时域处理单元完成，计算量低。频率加权
图A.2Leq(RLB)算法框图
图A.2所示的Leg(RLB)算法只不过是等效声级（Leq）测量的一个频率加权形式，Leg定义见式（A.1）。Leq(W)=10log10
式中：
加权滤波器的输出信号；
参考信号幅度；
cTxidtl
小提示：此标准内容仅展示完整标准里的部分截取内容，若需要完整标准请到上方自行免费下载完整标准文档。