首页 > 国家标准(GB) > GB/T 18119-2000 低比特率通信的视频编码
GB/T 18119-2000

基本信息

标准号: GB/T 18119-2000

中文名称:低比特率通信的视频编码

标准类别:国家标准(GB)

标准状态:现行

发布日期:2000-06-07

实施日期:2000-10-01

出版语种:简体中文

下载格式:.rar.pdf

下载大小:KB

标准分类号

标准ICS号:电信、音频和视频技术>>电信系统>>33.040.20传输系统

中标分类号:通信、广播>>通信网>>M16信息传输指标

关联标准

采标情况:eqv ITU-T H.263:1996

出版信息

出版社:中国标准出版社

书号:155066.1-17070

页数:39页

标准价格:18.0 元

出版日期:2004-04-16

相关单位信息

首发日期:2000-06-07

复审日期:2004-10-14

起草单位:信息产业部电信传输研究所

归口单位:信息产业部(通信)

发布部门:中华人民共和国国家质量监督检验检疫总局

主管部门:信息产业部(通信)

标准简介

本标准定义一种以低比特率压缩视听业务的运动图像分量的编码表示法。 GB/T 18119-2000 低比特率通信的视频编码 GB/T18119-2000 标准下载解压密码:www.bzxz.net

标准图片预览






标准内容

ICS33.040.20
中华人民共和国国家标准
GB/T 18119—2000
eqvITU-TH.263:1996
低比特率通信的视频编码
Video coding for low bit rate communication2000-06-07发布
2000-10-01实施
国家质量技术监督局
GB/T18119—2000
本标准是等效采用国际电信联盟ITU-TH.263:1996《低比特率通信的视频编码》建议制定的,其中考虑到我国通信网及具体应用业务情况,作适当改动,更适合于我国国情。标准中的章节依据GB/T1.1—1993的规定作适当改动。原文中有关“基于语法的算术编码模式”改为“语义基算术编码模式”更适于国内应用。GB/T18119—2000《低比特率通信的视频编码》包括8个附录。本标准的附录A、B、C、D、E、F、G、H为标准的附录。本标准由中华人民共和国信息产业部提出。本标准由信息产业部电信研究院归口。本标准起草单位:信息产业部电信传输研究所。本标准主要起草人:黄东霖、杨淑京、辛伟。I
GB/T18119—2000
ITU前言
ITU电信标准化部门(ITU-T)是国际电信联盟的一个常设机构,ITU-T负责研究技术、操作和资费问题,并且为了实现全世界的电信标准化,对上述问题发布建议。每4年召开一次的世界电信标准化会议(WTSC)确定ITU-T研究组的研究课题,并根据这些课题形成建议。
ITU-T建议H.263由ITU-T15研究组(1996年5月)修订,并由WTSC批准。1范围
中华人民共和国国家标准
低比特率通信的视频编码
Video coding for low bit rate communicationGB/T18119—2000
eqvITU-TH.263:1996
本标准定义一种以低比特率压缩视听业务的运动图像分量的编码表示法。视频信源编码算法的基本结构基于ITU-TH.261。并增加四个通用的编码选项以提高性能。2引用标准
下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。ITU-T建议H.223(1995)低比特率多媒体通信的复用协议ITU-T建议H.242(1993)
使用直至2Mbps的数字信道在视听终端间建立通信的系统ITU-T建议H.245(1995)
多媒体通信的控制协议
ITU-T建议H.261(1993)
ITU-T建议H.262(1995)
ITU-T建议H.320(1993)
ITU-T建议H.324(1995)
3主要指标
编解码器框图见图1。
PX64kbps视听业务的视频编解码器运动图像和相关视听的通用编码(ISO/IEC13818-2)窄带ISDN可视电话系统和终端设备低比特率多媒体通信的终端
外部控制
酷码能制
妞拍用
包)视频缩码器
视就复用
D)机频料码器
视频编解码器方框图
国家质量技术监督局2000-06-07批准安兹
疆冲器
比持部
2000-10-01实施
3.1视频输入与输出
GB/T18119—2000
为了使625行和525行两种电视标准的地区内和地区间的视听业务问题能以一个建议予以解决,信源编码器对基于通用中间格式(CF)的图像进行。本标准不涉及输入和输出电视信号的标准及完成来自或进入信源编码格式的必要转换方法。输入和输出电视信号可能是复合的或分量的,模拟的或数字的。
3.2数字输入与输出
视频编码器输出一个完整的数字比特流,可以包含其他多种方便工作的信号(例如H.223建议中的规定)。视频解码器完成相反的过程。3.3抽样频率
采用视频行速率的整数倍对图像抽样。该抽样时钟与数字网络时钟不同步。3.4信源编码算法
采用画面之间预测和对剩余信号的变换编码这两者的混合方法。使用画面之间的预测是为了压缩其时域余量,使用变换编码是为了降低图像的空域元余量。解码器具有运动补偿的能力,编码器可以根据用户的选择结合这种技术。与H.261中采用全像素精度和环形滤波器不同,H.263采用半像素精度的运动补偿。发送信号用变长编码。除了H.263核心编码算法外,在以下节中描述了4个通用的编码选项。所有选项可同时或独自出现。3.4.1不限制运动矢量模式
本选项模式中,允许运动失量出现在画面外。边缘像素可用于预测“不存在”像素。本模式中,若有通过画面边缘的运动发生,则可看到画面质量的明显改善,尤其是较小画面格式(见附录D)。而且,本模式扩展了运动失量范围,因此可用较大的运动矢量。本模式特别适用于摄像机运动的情况。3.4.2语义基算术编码模式
本选项模式中,用算术编码代替可变长编码。其信噪比与重建画面一样,但产生的比特数大大减少了(参见附录E)。
3.4.3高级预测模式
本选项模式中,P画面的亮度部分用重叠运动补偿(OBMC)(见附录F)。画面的一些宏块中,用4个8×8矢量代替一个16×16失量。由编码器决定采用何种类型矢量。4个矢量增加了所用比特数,但预测效果得以改进。使用本模式使质量有了可观的改进,尤其是主观质量,因为OBMC会减少方块效应。
3.4.4PB顿模式
PB顿包括两个画面,作为个单元进行编码。PB顿的命名来自于H.262中画面类型,分为P画面和B画面。因此,PB顿包括一个P画面和一个B画面,P画面由前一已解码的P画面预测获得,B画面由前一已解码的P画面和当前解码的P画面共同预测获得。称为B画面是因为部分B画面可由过去和将来的画面双向预测。本编码选项中,可大大提高顿速率而不过多增加比特率(见附录G)。3.5比特率
传输时钟由外部提供。视频比特率可变。视频比特率的限制不由本建议给出,而由终端或网络给出。3.6缓冲器
为了符合附录B定义的假想参考解码器的要求,由编码器控制其输出比特率。在每一有效时钟周期都提供视频数据。这一点可由MCBPC填充比特来保证(见表4和表5),或若采用前向纠错,则由前向纠错填充顿来保证(见附录H)。对任一画面编码所产生的比特数不能多于在1024比特单元内测定的参数BPPmaxKb所定义的最大值。BPPmaxKb参数所允许的最小值根据比特流中协商的最大信源格式决定(见表1)。编码器可使用大于表1所定义的BPPmaxKb值,此值由外部方式协商,例如:H.245建议。3.7传输的对称性
GB/T18119—2000
本编解码器可以用于单向或双向可视通信。表1每一信源画面格式的BPPmaxKb信源格式
3.8误码处理方式
BPPmaxKb
误码处理方式由外部方式提供,(例如:H.223建议),若不由外部方式提供(例如H.221建议),则采用附录H中所描述的可选纠错编码和定顿。解码器能以INTRA模式给编码器发送下顿图像的一个或多个GOB命令,其中含有编码参数,这样可避免缓冲器溢出。解码器也可发送(例如:H.245建议)。
3.9多点操作
个非空GOB头的命令。此信号的传输方式由外部方式决定附录C中包含支持交换型多点操作所需的各种性能。4信源编码器
4.1信源格式
信源编码器工作于每秒出现30000/1001(大约29.97)次的非隔行扫描的画面中,每画面频率的容差为士50ppm。
画面按一个亮度和两个色差分量进行编码(Y,CB和CR)。这些分量和代表其抽样值的代码都与CCIR建议601所规定的相同。
黑电平=16bzxz.net
白电平=235
零色差=128
峰值色差=16和240
这些值都为标称值,编码算法对1到254的输入值进行计算。有5个标准画面格式,SOCIF,OCIF,CIF,4CIF和16CIF。每一画面格式中,亮度抽样结构为每行dx个像素,垂直方向每画面dy行。两个色差分量的抽样为每行dx/2个像素,垂直方向每画面dy/2行。每一画面格式都由表1给出其dx.dy,dx/2,dy/2的值。对于每一画面格式,色差抽样是固定的,其块边界与图2所示的亮度块边界一致。每一画面格式中像素比例一致,且与H.261建议QCIF和CIF的定义一致,为(4/3)×(288/325)。除子QCIF画面格式外,所有标准画面格式覆盖的画面区域宽高比为4:3。所有解码器可工作于SQCIF和QCIF画面格式,些解码器也可工作于CIF,4CIF和16CIF,编码器可工作于SQCIF和QCIF中的一种画面格式。由编码器决定采用何种格式,但不能两种同时使用。一些编码器也可工作于CIF,4CIF,16CIF。由外部方式决定具体使用何种画面格式,例如H.245建议。对于可能出现的画面格式和视频编码算法的完整描述参考有关终端描述,例如:H.324建议。3
画面格式
GB/T18119—2000
表2每一画面格式中每行像素数和行数亮度的像素数(dx)
亮度的行数(dy)
色差的像素数(dx/2)
XXXXXX
XXIXXXX
×××
XXIXXXX
××x×x
亮度抽样
色差抽样
块边缘
图2亮度和色差抽样的位置
色差的行数(dy/2)
注:对CIF而言,每行像素数与525行或625行信源的亮度和色差信号的有效部分的抽样兼容,亮度和色差信号有效部分分别以6.75MHz和3.375MHz进行抽样。这些频率与CCIR建议601的频率间有个简单对应关系。编码器应该有办法限制其最大画面速率,致使两个发送画面间有一个最少数目的非发送画面,这个最少数目由外部方式决定(例如:H.245建议)。PB顿模式中,为了计算非发送画面的最小数量,将PB顿单元的P画面和B画面作为两个独立画面。4.2视频信源编码算法
信源编码器的一般形式见图3。主要环节是预测、块变换、量化。4.2.1GOB、宏块和块
每一画面都可分为块组(GOB)。由画面格式决定一个块组包含KX16行,(SQCIF、QCIF和CIF中K=1,4CIF中K=2,16CIF中K=4)。SQCIF中每顿GOB数为6,QCIF中GOB为9,CIF,4CIF,16CIF中为18。GOB的计算是由GOB的垂直扫描实现的,从最上GOB(0号)开始,结束于最下GOB。例如:CIF画面格式的GOB排列见图4。每个GOB数据包括GOB头(可为空),其后有宏块数据。每个GOB中的GOB数据以逐次增加GOB号的顺序来发送。每一GOB可分为若于个宏块。每一宏块Y分量为16X16,在空域相应的CB和CR为8X8像素。而且,如图5所示,每一宏块包含有4个亮度块,在空域对应有2个色差块,每一亮度或色差块对应的Y、CB或CR为8X8。对于SQCIF、QCIF和CIF而言,一个GOB包含有一个宏块组,对于4CIF而言包含2个宏块组,对于16CIF而言包含4个宏块组。4
GB/T18119—2000
T一变换Q一量化P一具有运动补偿可变延退的画面存储CC一编码控制PINTRA/INTER标志:t一发送或不发送标志qz量化器指示q一变换系数的量化标志;V运动失量图3信源编码器
宏块的计算是通过从左到右的水平扫描来实现的,起始于上一宏块,结束于下一宏块。每个宏块按增长宏块号的顺序发送宏块数据。每个块按增长块号的顺序发送数据(见图5)。0
CIF画面中GOB的排列
5宏块中块的排列
本标准不涉及模式选择的原则和发送块的原则,这些内容随着编码控制策略的改变而改变。对发送的块进行变换,产生的系数被量化和编码。4.2.2预测
预测为帧间预测,并且加入了运动补偿(见4.2.3)。提供预测的编码模式叫INTER;若不提供预测,则为INTRA。INTRA编码模式由画面级(I顿是INTRA,而P顿是INTER)来标明,或由P帧中的宏块级标明。在可选的PB帧模式中,B帧总为INTER模式。B顿有一部分是双向预测(参见附录G)。5
4.2.3运动补偿
GB/T18119—2000
解码器中每个宏块可接受一个天量,或者采用高级预测模式时,每个宏块可有一个或4个天量(参见附录F)。若用PB顿模式,则每个宏块发送一个附加的delta矢量,以调整B宏块预测的运动矢量。运动矢量的水平和垂直分量可为整数或半整数值。在缺省预测模式时,范围限制在[一16,15.5](对于B顺的前向和后向矢量分量而言有效)。而在不限制矢量模式时,矢量分量的最大范围为[一31.5,31.5],这种限制下,若预测模式范围在{一15.5,16]之间,则每一运动矢量分量的预测值中仅能得到一个范围在【一16,15.5]之间的值。若预测范围在【一15.5,16]之外,则可得到范围在[一31.5,31.5]之间,与预测值加零值标号相同的所有值(见附录D)。水平或垂直运动矢量分量为正表明预测是由空间位置中位于被预测像素的右边或下边的前一参考画面中的像素形成的。
运动矢量的限制条件是所参考的所有像素都位于编码画面区,除了采用不限制运动矢量模式和/或高级预测模式之外(见附录D和附录F)。4.2.4量化
INTRA块第一个系数的量化器数目为1,其余的量化器数目为31。在同一宏块内,除第一个INTRA块外,所有系数都用同一量化器。判决电平不作规定。INTRA块第一个系数通常称为直流值,其统一的量化步长为8。其余31个量化器中每一个使用等间隔的重建电平,围绕零有中心死区,步长为2到62的偶数值。具体见6.2。
注:量化步长较小时,不能表示变换系数的全动态范围。4.3编码控制
为了控制所编码视频数据的产生速率,采用了不同的儿个参数。这些参数包括信源编码器的前处理、量化器、块重要性判决和时域子抽样。本标准不涉及总体控制策略中对这些方法的提议。一旦引用,通过去整顿图像来进行时域子抽样。解码器可标识视频信号时域和空域分辨率之间某种交替方式的性能。编码器可在呼叫时标出其缺省的交替方式,并指示是否可响应解码器的请求,以改变交替方式。此种信号的传输方法由外部控制(例如:H.245建议)。
4.4强制更新
此功能以强制使用编码算法的INTRA模式来实现。更新模式不作规定。为了控制反变换失配误差的累积,当发送P顿中宏块的系数时,每宏块最多发送132次就以INTRA模式编码一次。4.5起始码的字节组合
通过在起始码前插入少于8个零比特的填充码,可得到起始码的字节组合,起始码的第一比特是字节的第一比特(最高有效位)。若最高有效位的位置是从H.263比特流中第一比特开始,有整数倍的8比特,则起始码是字节组合。所有画面起始码都为字节组合,GOB和EOS码可能为字节组合。注
1某一画面所用比特数可变,但为8的倍数2H.324需要H.263编码器来安排以逻辑信息单元开始的起始码,并将其通过适配层(AL_SDU's)。5语法和语义
视频复用被分为4层水平结构,从上到下分别为:*图像层
*块组层
* 宏块层
*块层
语法结构见图6。其缩略语和语义的定义下一节给出。6
GB/T18119—2000
国国国
视频比特流的语法框图
GB/T18119—2000
除非特别说明,否则最高有效位首先发送,为1比特,并位于本标准码表的最左比特。除非特别说明,否则所有未用比特或空闲比特置为“1”。除非ITU中定义其功能,否则空闲比特不用。5.1图像层
每顿图像的数据由图像头及其随后的GOB数据构成,并伴随有序列结束码和填充比特。图像结构示于图7。若CPM指示,则PSBI出现。若PTYPE指示使用“PB”顿模式,则TRB和DBQUANT出现。PSPARE和PEI的合并可不出现,EOS可不出现,而若EOS出现,则ESTUF可能出现,丢弃图像的图像头不发送。
PSC TRPTYPE PQUANT CPMPSBITRB DBQUANT PEIPSPAREPEI
图7图像层结构
5.1.1图像起始码(PSC)(22比特)GOBESTUFEOSPSTUF
PSC为22比特的码,值为0000000000000000100000。所有图像起始码都为字节组合。这一点可通过在起始码前插入PSTUF来实现。由此起始码的第一比特为字节的第一比特(最高有效位)。5.1.2时域参考(TR)(8比特)
为8比特,有256种可能值。TR值构成为:前发送顿头的值加1,再加前一发送顿之间未发送的帧数(以29.97Hz)。运算在低8位内进行。在可选的PB顿模式中,TR仅用于P顿,B顿的时域参考见5.1.7。
5.1.3类型信息(PTYPE)(13比特)整顿图像信息:
bit1:只为“1”,以避免起始码的争用bit2:只为“0”,以区别于H.261bit3:分屏指示,0\断,“1”通bit4:文件摄像机指示,“0”断,“1”通bit5:整顿解除冻结,“0”断,“1”通bit6~8:信源格式,“000\禁止。“001”SQCIF,“010\QCIF,“011”CIF,“100”4CIF,101”16CIF,“110”保留,“111”保留
bit9:图像编码类型,“0\INTRA(I顿),“1\INTER(P顿)bit10:可选的不限制运动失量模式,0”断,“1”通bit11:可选的语义基算术编码模式,“0”断,“1”通bit12:可选的高级预测模式。“0”断,“1”通bit13:可选的PB顿模式。“0”般的I或P顿,“1\PB顿分屏指示信号指示所解码图像的上半部或下半部依序逐次显示。此比特对图像的编码或解码无直接影响。
解除冻结画面为来自编码器的信号,它响应分组重发的请求(若不确认),或快速更新请求(见附录C),且允许解码器从冻结图像模式退出,并以一般方式显示解码画面。若6~8比特指示信源格式与前一顿头不同,则当前图像为1顿。10~13比特指示编码器和解码器(分别见附录D,附录E,附录F和附录G)协商后应采用何种模式。若比特9置0”,比特13也要置“0”。5.1.4量化器信息(PQUANT)(5比特)5比特的定长码。指示一幅图像采用量化器QUANT,直至被任意顺序的GQUANT或DQUANT所更新。此码由QUANT值的自然二进制表示,值为半步长,范围从1~31。5.1.5持续显示多点(CPM)(1比特)此1比特码表示是否使用可选的持续显示多点模式(CPM)。“0”为断,“1”为通。CPM的使用见附8
录c。
5.1.6图像子流指示(PSBI)(2比特)GB/T18119—2000
2比特的定长码。在CPM模式指示使用持续出现多点模式时出现。顿头及其随后直到下一顿或GOB起始码前的信息,其码字由子比特流号的自然二进制表示(参见附录C)。5.1.7B帧的时域参考(TRB)(3比特)若PTYPE指示\PB顿”(见附录G),且指示从最后的P或I顿开始,到B顿前未发送图像的数量,则出现TRB。此码字由未发送图像数量加1所形成的自然二进制码表示。未发送画面的最大数量为6。5.1.8B顿的量化信息(DBQUANT)(2比特)若PTYPE指示“PB帧”,则出现DBQUANT(见附录G)。解码过程中,每一宏块都有量化参数QUANT。PB顿QUANT用于P块,B块使用不同的量化参数BQUANT。QUANT范围从1~31。DBQUANT指示了QUANT和BQUANT之间的关系,如表3所示。本表中,“”为整除符号。BQUANT范围从1到31,若表3所产生的BQUANT值大于31,则减到31。表3DBQUANT码字与QUANT和BQUANT之间的关系DBQUANT
5.1.9额外插入信息(PEI)(1比特)此比特置为“1”。表明以下可选数据域出现。5.1.10备用信息(PSPARE)(0/8/16比特)BQUANT
(5XQUANT)/4
(6XQUANT)/4
(7XQUANT)/4
(8XQUANT)/4
若PEI置1,则9比特中有8比特的数据(PSPARE),和另一个指示后面是否还有9比特的PEI比特,如此类推。在ITU作出规定前,编码器不得插入PSPARE。这样以后ITU就可在PSPARE中规定后向兼容附加信息。若PEI置1,所设计的解码器应能放弃PSPARE。若PSPARE后PEI置0,为了避免起始码的争用,则禁止使用PSPARE一XX000000。(X为任意,由此256个值中的4个被禁止值)。5.1.11填充(ESTUF)(变长)
少于8个0比特的变长码。编码器可在EOS码前直接插入此码,若ESTUF出现,则ESTUF的最后一比特为字节的最后一比特(最后一个无效位),以便EOS起始码为字节组合。所设计的解码器应能放弃ESTUF
5.1.12结束序列(EOS)(22比特)
22比特长。值为0000000000000000111111。取决于编码器是否插入此码。E0S为字节组合。通过在起始码前插入ESTUF可得到EOS,因此,起始码的第一比特为字节的第一比特(最高有效位)。5.1.13填充(PSTUF)变长)
少于8个0比特的变长码。编码器可插入此码作为下一个PSC的字节组合。PSTUF的最后一比特为字节的最后一比特(最后一个无效位),因此,从H.263比特流中第一比特开始到PSTUF结束的视频比特流为8的倍数。所设计的解码器应能放弃PSTUF。若由于某原因,在某段时期内编码器停止图像编码,以后又开始编码,则在编码器停止前会发送PSTUF,以避免编码器重新开始编码前,先前图像中有最多7个比特会停止发送。5.2块组层
每一GOB数据由GOB头及其随后宏块数据构成。结构示于图8。每一GOB包括一个或多个宏块。每一图像的第一个GOB(O号)不发送GOB头。而别的GOB中,根据编码策略,GOB头允许为空。由外部方式决定解码器是否给远端的编码器发送非空GOB头,例如:H.245建议。若GBSC出现,则9
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。