GB/T 17975.7-2002
基本信息
标准号:
GB/T 17975.7-2002
中文名称:信息技术 运动图像及其伴音信息的通用编码 第7部分: 先进音频编码(AAC)
标准类别:国家标准(GB)
标准状态:现行
发布日期:2002-05-08
实施日期:2002-10-01
出版语种:简体中文
下载格式:.rar.pdf
下载大小:4562257
标准分类号
标准ICS号:信息技术、办公机械设备>>35.040字符集和信息编码
中标分类号:电子元器件与信息技术>>信息处理技术>>L71编码、字符集、字符识别
关联标准
采标情况:ISO/IEC 13818-7-1997
出版信息
出版社:中国标准出版社
书号:155066.1-18864
页数:190页
标准价格:55.0 元
出版日期:2002-10-01
相关单位信息
首发日期:2002-05-08
复审日期:2004-10-14
起草人:梁彬
起草单位:东南大学
归口单位:全国信息技术标准化技术委员会
提出单位:中华人民共和国信息产业部
发布部门:国家标准化管理委员会
主管部门:国家标准化管理委员会
标准简介
本标准描述了MPEG-2音频非向下兼容标准,称为MPEG-2先进音频编码,即ACC。ACC与现有的MPEG-2BC(MPEG-1向下兼容)相比是一个更高质量的多声道标准。对五个全带宽声道音频信号,在数码率为320kbit/s时,MPEG-2ACC音频标准满足ITU-R“不可分辨”质量的要求。 ACC解码器的工作过程利用了一系列必选或可选的模块。表1列出了这些模块和它们是否为必选的。必选模块在任何框架中都是必须的。可选模块在某些框架中可以省略。 GB/T 17975.7-2002 信息技术 运动图像及其伴音信息的通用编码 第7部分: 先进音频编码(AAC) GB/T17975.7-2002 标准下载解压密码:www.bzxz.net
标准内容
ICS35.040
中华人民共和国国家标准
GB/T 17975. 7—2002
idt IS0/IEC 13818-7:1997
信息技术
运动图像及其
伴音信息的通用编码
第7部分:先进音频编码(AAC)Information technology Generic coding of movingpictures and associated audio information-Part 7:Advanced audio coding2002-05-Q8 发布
中华人民北和国
国家质量监督检验检疫总局
2002-10-01实施
GB/T 17975.7—2002
ISO/IEC 前言
引用标推
符号和黯略语
捐述比特流语法的力法
通用信息
无噪声编码
量化…
比例因了
联合编码
时域噪市整形(TNS)
滤波器组和块切换
增益控制
附录A(标准的附录)崔人些码书表附录B(挞示的附录)MSDL和编码器专利所有者
附录C(提示的附录)
附录(提示的附录)
参号文献
GB/T17975.7--2002
本标准等同采用ISO/IE心13818-7:1997&信息技术运动阅像及其伴音的通用编码信息第7部分:光进音频编码(AAC)》以及ISO/1EC13818-7:1997/技术期误1。GB/117975在《信息技术运动图象及其伴音信息的通用编码》的总标题下,目前包括以下几个部分:
第1部分:系统:
第2部分:视频;
第3部分:音题。
第7部分:先进音颗编码(AAC)
本标维的附录 A 为标准的附录。本标准的附录 B,附录[、附录E 和附录 F 为提示的附录。本标准由中华人民共和国信息产业部提出。本标推由全国信息技术标准化技术委员会归口。本标准起草单位:东南大学。
木标推主要起草人:奖镇扬、姜哗、陈艳阳,史名锐梁彬。GB/T17975.7—2002
ISO/IEC前言
ISO(国际标准化组织)和IEC(国际电工委员会)是批界性的标准化专门机构,1SO和IEC的成员国通过各个组织建立的技术委员会,积极参与特定技术领域的国际标准的起草工,作。1SO和IEC技术委员会在共同感兴趣的领域内进行合作,其他一些与ISO和EC有联系的官方和非官为国际组织也参与国际标准的制定工作。
在信息技术领域,IS()和IEC建立了一个联合技术委员会,即IS(O/IEC JTC1,被联合技术委员会采纳的国际标准草案在成员国范围内投票表决:发布--项国际标谁需要至少75%的成员国投票赞成。国际标准ISO/IEC13818-7是由ISO/EC JIC1/SC29(音频:像,多媒体和超媒体信息的编码分技术委员会)制定的。
国际标准ISO/IEC13818在总标题\信息技术一··运动图像及其伴音信息的通用编码”下,包括以下部分
第1部分:系统:
第2部分:规颊,
第3部分:音频;
第4部分:一教性测试:
第 6部分:DSM-CC展;
第7部分:先进音频编码(AAC):第9部分:系统解码器的实时接口扩展1第 10 部分:DSM-CC 的--致性扩展。附录A是ISO/IEC138187的一个组成部分。附录B到附录F仅用作参考资料GB/T17975.7- 2002
标准化组织 ISO/IEC JTC 1/SC 29/wG11,也即运动图像专家组(Moving Pictures Expert Group)(MPEG),成立于1988年,任务是制定低效据率下数字视频和音频的编码方案,1992年11月,MPEG完成了第一阶段的音频标准(MPEG-1).ISO/IEC 11172-3,在第二阶段的发展计划中,MPEG音频工作组对MPEG-1的音额进行多道的扩展(MPGE-2BC),它能够与已有的MPEG-1系统向下兼容,以及—-个低于MPEG-1采样频率的音频编码标准,ISO/IEC13818-3。范围
中华人民共和国国家标准
信息技术运动图像及其
伴音信息的通用编码
第7部分:先进音频编码(AAC)Information technologyGeneric coding of movingpictures and associated audio information-Part 7: Advaaced audio codingGB/T17975-7—2002
idt IS0/IEc 13818-7:1997
本标准描述了 MPEG-2 音题非向下兼容标准,称为 MPEG-2 先进音频编码,即 AAC。AAC 与现有的MPEG-2HC(MFEG-1向下兼容)相比是一个更高质量的多声道标准。对五个全带宽声道音颗信号在数码率为320kbit/时,MPEG-2AAC音频标准满足ITU-R\不可分辨\质量的要求。AAC解码器的工作过程利用了一系列必选或可选的模块。表1列出了这些模块和它们是否为必选的。必选模块在任何框架中都是必须的。可选模块在某些框架中可以省略。表1
块名称
比特疏装配器
无燥声解码
反量化器
比例因子
强度/据合
波器组
增益控制
MPGE-2 AAC 模块简述
必选/可避
图1.1和图1.2给出了MPEG-2的基本结构。正如长1指山的.解码器中包括了必选和可选的模块,参见图1.2。图中数据的流向是从左至右,由上至下。解码器的任务是找出比特流中对量化音额频谱的描述,解出量化值和其他重建信息,恢复量化频谱,过比特流里的可用模快对恢复的频增处理,从而逼近输人比特流给出的实际信号频谱,最后将频谱值从域变换到时域中去,其中可选的增益控制模块可用可不用。在重建初始化和频谱重建的定标之后提供一系列的可选模块对一或者更多的频谱进行够正,使编码效率更高。对于每一个运作在频城的可选模块,歇认的选项是“通过”,在任何情况下,当该项换作被省略时,其输人端的频谱信号不作修改地直接通过该模块,中华人民共和国国家质量监督检验检疫总局2002-05-08批准2002-10-01实铺
GB/T 17975. 7--2002
比特流去格式化模块的输人是MPEG-2AAC比特流。去格化器MPEG-2AAC数据流的各部分分离成为对应各个模快的数据部分,并且提供给该模块与之有关的比特流信息。比特流去格式化器的输出是:
·无噪声缩码颊谱的分区信息;·无噪声编码的频谱;
*M/S的判决信息(可选):
·预测器状态信息(可选)
·强度立体声控制信息和耦合声道控制信息(均可选);·时域噪声整形(TNS)信息(可选·滤波器控制信息;
·增益控制信息(可选)。
无噪声解码模块从比特流去格式化器取得瘩息,分析该信息,对霍夫曼码字解码·重建量化频谱以歧蛋夫显编码和 DPCM 编码的比例因子。无噪声解码模块的输人是:
■无声编码频谱的分区信息:
■无噪声编码的频谱。
无噪声解码模块的输出是:
·比例因子的解码整型表示:
*频谱的量化值。
反量化模块获得频谱的量化值,将整型值转化成非归一化的重建频谱。量化器是非均勾量化。反量化模块的输入是:
·频谱的量化值。
反量化模块的输出是:
非H一化的反量化频谱,
比例因子模块将比例因子的型表示转化为真实值,与相应的非归一化反量化频谱相乘。比例因子模块的输入是:
·比例因子的整型表示;
·非归一化的反量化颊谱。
比例因子模块的输出是:
·归一化的反量化频谱。
M/S模块在M/S判决信息的控制下,将谱对从中间/旁边转化成为左/右,从而提商编码效率。M/S模块的摘人是:
*M/S 判决信息;
·与成对声道相关的,归一化的反最化频谱。MS模块的输出是:
·经过M/S解码的、与成对声道相关的、归一化的反盛化频谱。注意:对于每个声道单独编码的归-一化的反量化频谱,M/S模块不加处理.而是让它们直接通过不加修改。如果M/S模块不可用,所有的频谱都不加繁改地直接通过。2
GB/T 17975.7---2002
预测模块是编码器中预测的逆过程。它将编码时预测模块去除的允余重新引人,并由预测状态信息加以控制。该模块由一个二阶后向自适应预测器实现。预测模快的输人是:
·预测器状态息+
*归一化的反量化频谱。
预测模块的输是:
·恢用预测器后的归一化的反量化频谱注意:如果未使用预,归一化的反量化频谱不加懿政地直接通过。强度立体声/鹅台模块完成成对频谱的强度立体声解码。此外,在耦合控制信息的控制下,它将非独立切换合声道的有关信息加到该点的频谱之上。强度立体声/耦合模块的輪人是:*反量化数谱:
强度立体声控制信息和耦合控制信息。强度立体声/耦合模块的擒州足:经过强度和耦合市道解后的反量化频谱。注意,如采这个模快的任一部分被莱用反量频谱不加峰改地直接通过该慎块。强度立体声模块和M/S懂块的安排使得对下给定的狂何比例因了题段和一获题谱对而言,M/S和强度立体声的操作是与斥的。时域噪声整形(TNS)模块对编码噪声的精细时间结构加以控制。在缩码器中,TNS将所处理的时域信号包络变平坦。对于解码器,在TNS信息的控制下,用相反的过程来恢复真实的时域包络。这种恢复是道过对部分频谱数据的滤波来完成。TNS 模块的输,人是:
·反量化的频谱;
?TNS 信息.
TNS模块的输出是:
,反量化的颊谱:
注意:如果该模块被禁用,反化频谱值不加修改地直接通过,滤波器组模块为编码器中频率映射的相反过程,由滤波器组控制信息和可能存在的增益控制信息加以表示。滤波器组便用了改进离散余弦反变换(1MiC1)。如果没有使用增益控制模块,按window5eAuene的取值不同,1MT的输人出1024线或128线的频谱系数构成(见6.3、表6.11)相反,如果使用了增益控制模块,滤波器组的输人则由四组256线或32线的频谱系数构成,其取决于windowsequence 的值。
滤波器组模块的输人是:
*反量化的频谱;
·滤波器组的控制信息。
滤波器组模块的输出是:
·重建的时域音频信号。
如果存在增益控制模块,它会在该模块输人端信号的4个频带上分别加上个独立的时域增益控制(这4个频带是由缩码器的增益控制模块的PQF滤波器组生成的)。然后,它将4个频带组合起米升通过增益控制模块重建时间波形。3
增益控制模块的输人是:
*重建的时域音频信号;
.增益控制信息。
增益控制模块的输出是:
·重建的时域音频信号;
GB/T 17975. 7—2002
如果增益控制模块没有激活,重建的时域音频信号直接从滤波器组通过:成为解码器的输出,该模块仅用于采样频率可分级(SSR)框架。输入时间信号
强度/幅合
送代环路
此例因了
最化野
无噪声编码
GB/T17975.7
摘码音短流
MPEG·2AAC编码器图
编码音频流
无筛声解码
反量化器
比因子
蛋克/耦台
裤波器组
增益控情
图1.2MPEG-2AAC解码器
2引用标准
GB/T 17975. 7—2002
下列标谁所包含的条文,道过在本标推中引用而构成为本标推的茶文,本标准出版时,所示版本均为有效。所有标准都会被订,使用本标准的各方应探讨使现下列标准最新版本的可能性。GB/T17191.3一1997信息技术具有1.5Mbit/s数据传输率的数字存储媒体运动图像及其伴音的编码第3部分:音颊(idtIS0/IEC11172-3:1993)信息技术运动图像及其伴音信息的通用缩码第1部分:系统(idtISO/GB/门 17975.1-—2000
IEC 13818-1:1996)
GB/T17975.3一2002信息技术运动图像及其伴音信息的通用编码第3部分:音频(idt1S0/EC 13818-3:1998)
3定义
本标准采用下列术语
3.1混叠alias
采样所产生的镜像信号分量。
3.2分析滤波器组analysisrilierbank在编码中把宽带PCM音频信导变换成一组谱系的滤波器组数。3.3辅助数据ancillary data
时以用作辅助数据传输的比特流的一部分,3.4音频缓冲器audiebuffer
系统月标解码器(GB/T 17975.1)中用于存储压缩音频数据的缓冲器。3.5 巴 Bark
对应于人类听觉临界带宽的标准单位。3.6向下兼容性backward compatibility新的编码标推是向下可兼容旧的编码标准,即:按旧的缩码标准设计成的解码器也能对按新的编码标准产生比特流的全部或者部分进行解码。3.7比特率hitrate
压比特流传输到解码器输人端的速率。3.8比特流,码流bitstreamstream用作数据编码表示的有一定次序的一纠比特。3.9比特筑检测器bitstrcam verifier二个进程,通过它来检查比特流是否符合在本标准中规定的全部要求。3.10快压扩block companding
某一时间内音频信号数字表示的归一化。3.11字节对齐bytealigned
在编码比特流中,如果某一比特的位置(从音频数据交换格式(见6.1)的比特流的第一位或者音数数据传递格式(见6.2)的同步字的第位开始算起)是8的倍数,则该比特就称为字节对齐的。3.12字节byte
8 个比特的序列。
3. 13 中置声道 centre channcl一个意频声道,用来稳定前沿立体映像的中问成分。G
3.14 市道 channel
GB/T 17975.7—2002
用来表示在一收听位置再现音频信号的数据序列。3.15编码音频比特流coded audiobitstream音频信号的编码表示。
3.16编码表示 caded representation以编码形式表示的数据单元。
3.17 压缩 compression
用缩减比特数表示数据项的内容。3.18恒比特率constant bitrate编码比特流从川始到结束的比特率是常量的操作。3.19CRC
循环亢余校验,以检测数据的止确性。3.20临界带critical band
这一带宽单位丧示了人类听览系统的标准带宽划分,与人的耳蜗的固定长度相对应.在低频时近似等于 100 Hz,在高频时为 1/3 的八度音阶+约 700 Hz2。3.21 数据单元 data clcmcn1
编码前和编码后的数据项的表示。3.22去加重de-emphsis
对存储或传输的音频倍号所采取的一种滤波,以消除因加遗而引起的线性失真。3.23 解码流decoded atream
正缩比特流的解码重建。
3.24解码器decoder
解码处理的实体,
3.25解码decoding
在本标准中定义的一种数据处理.即读人编码比特流并输出解码的音频采样值。3.26数字存储媒体digitalstoragemiedia,DSM用于数存储或传输的器件或系统。3.27离散余弦变换discretecosinetransformDCT离散余弦正变换或离散余弦反变换。DCT是一种可逆的离散正交变换。3.28向下混合downmix
对n个声道进行矩阵变换得到少于的声道数。3.29编辑editing
对·个或多个压缩比特流进行操作,以产生一个新的比特流。合格的缩辑后的比特流必须满足本标推中观定的要求。
3.30重emphasis
音频信号在进行存储或传输前所进行的滤波,以提高高频信噪比。3.31编码器coder
编缩码处理的实体。
3.32编码coding
MPEG-2 中未规定的处理,即读人的音频采样流,并产生…个在本标准中定义的有效的比特流。3.33煽编码cntropycoding
GB/T 17975-7—2002wwW.bzxz.Net
信号数字表示中的一种变长无损编码,用以减少统计特性上的允余。3.34FFT
快速傅立叶变换。离散傅立叶变换的快速筛法(一种正交变换)。3.35滤波器组filterbank
覆盖全部音频范围的一组带通滤波器。3.36标记fleag
一个变量,可用来表示在本标准中定义的二值值集中的一个值。3.37向上兼容性orward compatibility新的编码标准是向上可兼容旧的编码标准的,郎,按新的编码标准设计成的解码器也能对按旧的编码标准产生的比特流进行解码。3.38Fs
采样颊率。
3.39汉宁窗HannWindow
在进行傅立叶变换前对音频样本块逐点使用的时间函数。3.40霍夫曼编码Huffrman coding嫡编码的一种具体方法。
3.41混合型滤被器组hybridfilterbank子带滤波器组与 MDCT 的级联组合。3.42 IDCT
离散余弦反变换。
3.43IMDCT
改进的离散余弦反变换。
3.44强度文体声intensity stereo基于在高频部分仅保留左右声道的能量包络,利用立体声音频节目中的立体声无关性或几余的一种法。
3.45联合立体卢编码jaintstertocoding利用立体声无关性或允余的一种方法。3.46联合立体模式joint stereo mode使用联合立体声编码算法的音题编码方法。3.4?低频增强声道low[reguencyenhancement(LFE)在多声道系统中用于低频效果的有限带宽声道3.48主音频声道mainaudiochannels在一个节目中所有的单声道单元(见8.2. 1)或双声道单元(呢8.2. 1)。3.49映射maping
音频信号通过子带滤波或MDCT进行从时域到频域的转换。3.50掩蔽masking
人类听觉系统的特性:一个音题信号在另一音频信号存在的情况下,无法被感知。3.51掩蔽阅值maskingthreshold时城和频域的函数,低于它的音频信号人耳则无法感知。3.52改进离散余弦变换modifieddiscretecosinetransform(MDCT)具有时域混登抵消特性的变换:对 M1CT 的分析可以参见附录 B的 B 2. 3. 1. 2。
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。