首页 > 国家标准(GB) > GB/T 25724-2010 安全防范监控数字视音频编解码技术要求
GB/T 25724-2010

基本信息

标准号: GB/T 25724-2010

中文名称:安全防范监控数字视音频编解码技术要求

标准类别:国家标准(GB)

标准状态:现行

出版语种:简体中文

下载格式:.zip .pdf

标准分类号

关联标准

出版信息

相关单位信息

标准简介

GB/T 25724-2010.
1范围
GB/T 25724规定了安全防范领域监控应用的数字视音频编码、解码过程的技术要求。
GB/T 25724适用于安全防范领域的视音频实时压缩、传输﹑播放和存储等业务,对于其他需要视音频编解码的领域也可参考采用。
2规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T 20090.2—2006信息技术先进音视频编码第⒉部分:视频
3术语、定义和缩略语
下列术语、定义和缩略语适用于本标准。
3.1术语和定义
3.1.1
“Z”字形扫描zig-zag scan
变换系数从较低的空域频率到较高空域频率(近似)的一个明确排列顺序。“Z”字形扫描用于帧宏块中的变换系数。
3.1.2
B条带B slice
根据同一条带内的已解码样点利用帧内预测进行解码,或者根据先前解码的参考图像利用双向预测进行解码的条带,对每个块进行帧间预测时最多使用两个运动矢量和参考索引。
3.1.3
Ⅰ条带l slice
根据同一条带内的已解码样点利用帧内预测进行解码的条带。
3.1.4
Р条带P slice
根据同一条带内的已解码样点利用帧内预测进行解码,或者根据先前解码的参考图像利用前向预测进行解码的条带,对每个块进行帧间预测时最多使用一个运动矢量和参考索引。
3.1.5
NAL单元NAL unit
一个语法结构,包含后续数据的类型指示和所包含的字节数,数据以RBSP形式出现,必要时其中还包括认证数据及散布的防伪字节。

标准图片预览

GB/T 25724-2010 安全防范监控数字视音频编解码技术要求
GB/T 25724-2010 安全防范监控数字视音频编解码技术要求
GB/T 25724-2010 安全防范监控数字视音频编解码技术要求
GB/T 25724-2010 安全防范监控数字视音频编解码技术要求
GB/T 25724-2010 安全防范监控数字视音频编解码技术要求

标准内容

ICS13.310
中华人民共和国国家标准
GB/T25724—2010
安全防范监控数字视音频
编解码技术要求
Technical specification of surveillance video and audio coding2010-12-23发布
中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会
2011-05-01实施
1范围
规范性引用文件
3术语、定义和缩略语
3.1术语和定义
3.2缩略语.
4约定:
4.1算术运算符
逻辑运算符
4.3关系运算符
4.4位运算符··
赋值运算符·
数学函数:
语法元素、变量和表
逻辑运算符的文字描述.
过程·
5视频部分
编码比特流和输出数据的格式·语法和语义,
解码过程
解析过程·
6音频部分…
6.1总体描述…
6.2编码器功能描述
6.3解码器功能描述
6.4比特分配描述
6.5存储、传输接口格式,
附录A(规范性附录)
附录B(规范性附录)
附录C(规范性附录)
附录D(规范性附录)
附录E(规范性附录)
附录F(规范性附录)
附录G(规范性附录)
附录H(规范性附录)
附录I(资料性附录)
附录J(资料性附录)
参考文献…
假设参考解码器(HRD)
字节流的格式
视频档次与级别
视频可用性信息(VUI)
补充增强信息(SEI)..
变长码表
音频档次和级别
异常声音事件类型定义
VAD检测
噪声消除
GB/T25724—2010
GB/T25724—2010
请注意,本标准的某些内容有可能涉及专利,本标准的发布机构不承担识别这些专利的责任。本标准的附录A~附录H为规范性附录,附录I和附录J为资料性附录。本标准由中华人民共和国公安部提出。本标准由全国安全防范报警系统标准化技术委员会(SAC/TC100)归口。本标准起草单位:公安部第一研究所、北京中星微电子有限公司、北京中盾安全技术开发公司、中星电子股份有限公司、清华大学、香港大学、大连理工大学、江苏东奇信息科技有限公司、中国传媒大学信息工程学院、国家多媒体软件工程技术研究中心、宁波艾利特科技发展有限公司、杭州恒生数字设备科技有限公司、公安部第三研究所、浙江大华技术股份有限公司、北京声迅电子有限公司、天津市亚安科技电子有限公司、深圳市艾立克电子有限公司、浙江大立科技股份有限公司、北京国通创安信息技术有限公司、天津天地伟业数码科技有限公司、金鹏电子信息机器有限公司、北京蛙视通信技术有限责任公司、杭州海康威视数字技术股份有限公司、中国科学院软件研究所、深圳中兴力维技术有限公司、北京汉邦高科数字技术有限公司、宁波舜宇光电信息有限公司、数维科技(北京)有限公司、新太科技股份有限公司、星际控股集团有限公司、浙江警官职业学院、北京富盛星电子有限公司、杭州华三通信技术有限公司、广东志成冠军集团有限公司。本标准主要起草人:陈朝武、邓中翰、李晓峰、杨晓东、张跃、邱嵩、冯宇红、卢京辉、余子龙、袁丽蓉、费宝顶、高嵩、林冬、陈喆、钟兴业、王生进、杨磊、房子河、杨国胜、范京京、邹章彪、晨、王耀辉、王浩、李鹏飞、王建勇、高磊、王、魏一、孙大瑞、闫建新、余和初、戴林、陈瑞军、于烨、黄麒麟、季鹏飞、韩大炜、刘蕾蕾、陈玉、周志文、向稳新、吴参毅。GB/T25724—2010
目前国内、国际没有专门针对安全防范监控应用的视音频编解码标准,现有的视音频编解码标准,都是针对广播电视和大众娱乐方面的应用,在安全防范领域直接采用具有很大的不适应性。本标准专门针对安防监控领域应用的特殊性,如:视频图像的实时传输性,全天候24h监控环境的适应性,场景视音频信息的忠实还原性等要求制定。本标准主要技术特点有:a)支持高精度视频数据编码,适应宽动态范围,保留更多的图像细节,满足忠实于场景的要求。视频支持8bit~10bit数据,并保留未来扩充到12bit~16bit的可能:b)支持顿内4X4预测与变换量化、自适应顿一场编码(AFF)和上下文自适应二进制算术编码(CABAC)等技术,获得更好的图像质量和更高的编码效率:支持感兴趣区域(ROI)变质量编码,在传输网络带宽或数据存储空间有限的情况下,优先保证ROI图像质量,节省非ROI的开销,提供更符合监控需要的高质量视频编码,提高监控系统整体性能;
d)支持可伸缩性视频编码(SVC),对视频数据分层次编码,满足不同传输网络带宽和数据存储环境的需求;
e)支持代数码书激励线性预测(ACELP)和变换音频编码(TAC)切换的双核音频编码,既保证对语音信号具有较好的编码效果,也保证环境(背景)声音的编码效果:支持声音识别特征参数的编码,避免编码失真对语音识别和声纹识别的影响;f)
支持绝对时间参考信息,特殊监控事件等监控专用信息。监控专用信息通过专门语法与视音频压缩编码数据一起传输和存储,便于快速检索、分类查询、视音频同步和监控数据的综合应用;h)
支持数据安全保护,规定加密和认证接口及数据格式,保证数据的安全性,完整性和非否认性。既保证格式的统一,便于互联互通,也保留足够的扩展灵活性,支持更高性能的加密和认证方式的增加和扩充。
相关专利情况说明
本文件的发布机构提请注意,声明符合本文件时,可能涉及与5.2.3.1、5.2.3.2、5.2.3.8、5.2.4.2,5.2.4.4.5.2.4.10.5.3.6.76.1.2,6.1.4.6.2.6.1.3,6.2.6.1.4.10中有关内容相关的专利的使用。
本文件的发布机构对于该专利的真实性,有效性和范围无任何立场。该专利持有人已尚本文件的发布机构表示,他愿意同任何申请人在合理且无歧视的条款和条件下!就专利授权许可进行谈判。该专利持有人的声明已在本文件的发布机构备案。相关信息可以通过以下联系方式获得:
专利持有人名称
北京中星微电子有限公司
北京中盾安全技术开发公司
中星电子股份有限公司
清华大学
数维科技(北京)有限公司
武汉大学
联系地址
北京海淀学院路35号世宁大厦(100191)北京海淀区首体南路1号(100048)天津经济技术开发区第四大街80号天大科技园A1座2层(300457)
北京海淀区清华园(100084)
北京海淀区中关村南大街2号(100086)湖北武汉市武汉大学(430079)联系人:曾娟鹏
通讯地址:北京海淀区学院路35号世宁大厦16层邮政编码:100191
电子邮件:zengjuanjuan@vimicro.com电话:010-68948888-8950
传真:010-68944075
联系人:马志江
通讯地址:北京海淀区首体南路1号邮政编码:100048
电子邮件:mzj76@yahoo.com
电话:010-88513553-828
传真:010-68454099
GB/T25724—2010
请注意除上述专利外,本文件的某些内容仍可能涉及专利。本文件的发布机构不承担识别这些专利的责任。
1范围
安全防范监控数字视音频
编解码技术要求
GB/T25724—2010
本标准规定了安全防范领域监控应用的数字视音频编码、解码过程的技术要求。本标准适用于安全防范领域的视音频实时压缩、传输、播放和存储等业务,对于其他需要视音频编解码的领域也可参考采用。
2规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。GB/T20090.2一2006信息技术先进音视频编码第2部分:视频3术语、定义和缩略语
下列术语、定义和缩略语适用于本标准。3.1术语和定义
“z”字形扫描zig-zagscan
变换系数从较低的空域频率到较高空域频率(近似)的一个明确排列顺序。“Z”字形扫描用于帧宏块中的变换系数。
B条带Bslice
根据同一条带内的已解码样点利用顿内预测进行解码,或者根据先前解码的参考图像利用双向预测进行解码的条带,对每个块进行顿间预测时最多使用两个运动矢量和参考索引。3.1.3
I条带Islice
根据同一条带内的已解码样点利用顿内预测进行解码的条带。3.1.4
P条带Pslice
根据同一条带内的已解码样点利用顿内预测进行解码,或者根据先前解码的参考图像利用前向预测进行解码的条带,对每个块进行顿间预测时最多使用一个运动失量和参考索引。3.1.5
NAL单元NALunit
一个语法结构,包含后续数据的类型指示和所包含的字节数,数据以RBSP形式出现,必要时其中还包括认证数据及散布的防伪字节。3.1.6
NAL单元流NALunitstream
由NAL单元组成的序列。
GB/T257242010
保留reserved
某些语法元素的特定取值,供中国安全防范监控数字视音频编解码技术标准工作组将来使用。符合本标准的比特流不应使用这些值,但是这些值将来可能在本标准的扩展版本中用到。3.1.8
闭环基音搜索closed-looppitch search即自适应码书搜索,从加权输入信号和长时预测滤波器状态估计基音延迟的过程。3.1.9
比特流bitstream
编码视音频及其相关数据,构成一个或多个编码视音频序列的比特序列。比特流既可用来表示NAL单元流,也可表示字节流。
变换系数transformcoefficient频率域的标量,与解码过程的反变换部分中一个特定的一维或二维频率索引相关联的系数。3.1.11
变换系数幅值transform coefficientlevel一个与特定二维频率索引相关联的整数量值,解码过程中用于计算变换系数的值。3.1.12
编码场codedfield
一个场的编码表示。
encoding process
编码过程
产生符合本标准的比特流的过程,本标准对视频编码过程不做规定。3.1.14
编码器encoder
实现编码过程的实体,包括软件及硬件。3.1.15
coded video sequence
编码视频序列
按照解码顺序排列的IDR图像和紧随其后的零个或多个非IDR图像组成的图像序列3.1.16
编码条带NAL单元codedsliceNALunit包含编码图像的一个条带的NAL单元。3.1.17
编码图像codedpicture
一幅图像的编码表示。一个编码图像可以是一个编码场,也可以是一个编码顿。3.1.18
coded picturebuffer
编码图像缓存区
一个先人先出缓存区,其存储方式按解码顺序排列。3.1.19
编码顿codedframe
一个顿的编码表示。
残差residual
样点或数据元素预测值与解码值之间的差值。2
参考场reference field
GB/T25724—2010
一个标记为参考图像的场,用于编码场中P条带和B条带的解码过程中的顿间预测。3.1.22
参考索引reference index
参考图像的索引。
参考图像reference picture
对解码顺序上后续图像的解码过程进行顿间预测的样点图像。3.1.24
参考顿referenceframe
一个标记为参考图像的,用于编码顿中的P条带和B条带的解码过程中的顿间预测。3.1.25
参数parameter
序列参数集、图像参数集或安全参数集中的一个语法元素。参数也用于量化参数一词中。3.1.26
层layer
没有分支等级关系中的一组句法结构。高层包含低层。编码层指编码图像序列层、图像层、条带层和宏块层。对于可伸缩性视频编码图像,不同层的图像具有不同的可伸缩性(如不同的空间分辨率)。3.1.27
场field
一顿中的相隔行的集合。一顿由两场组成,包括一个顶场和一个底场。3.1.28bZxz.net
场宏块fieldmacroblock
所包含的样点仅来自一个编码场的宏块。一个编码场的所有宏块均为场宏块。3.1.29
场扫描fieldscan
变换系数的排列顺序。与“Z”字形扫描顺序不同的是,它对列的扫描快于对行的扫描。场扫描用于场宏块中的变换系数。
代数码书algebraiccodebook
脉冲幅度和位置组成的一个集合。通过码字索引k按照一定的规则得到第k个激励码矢量的脉冲幅度和位置。
档次profile
本标准中的一个特定语法子集。3.1.32
底场bottomfield
组成顿的两个场中的一个。底场的每一行在空间位置上均位于其对应的顶场行的下面。3.1.33
电导频谱对immittancespectralpair线性预测系数的变换称为电导频谱对。将逆滤波器传输函数A(z)分解为一个偶对称和一个奇对称多项式函数,该函数在单位圆上的根,即电导频谱对。3
GB/T25724-2010
顶场topfield
组成顿的两个场中的一个。顶场的每一行在空间位置上均位于其对应的底场行的上面。3.1.35
短时合成滤波器shorttermsynthesisfilter对声道脉冲响应进行建模的滤波器。激励信号通过该滤波器可得到合成信号。3.1.36
二进制位bin
二进制位串中的1bit。
bin string
二进制位串
一串二进制位。二进制位串为二值化的语法元素值的二进制表示3.1.38
二值化binarization
语法元素所有可能值与一组二进制位串之间的唯一映射。3.1.39
反变换inversetransform
解码过程的一部分,将变换系数矩阵转换为空域样点矩阵的过程。3.1.40
emulationpreventionbyte
防伪字节
一个字节,其值等于0x03,可能在NAL单元中出现。防伪字节的出现可以保证在NAL单元的后续字节对齐的字节流中不会含有起始码前级,3.1.41
non-reference picture
非参考图像
不用于对任何其他图像进行顿间编码的图像。3.1.42
分量component
图像的三个样点矩阵(一个亮度矩阵,两个色度矩阵)中的一个矩阵或矩阵中的单个样点。在音频部分,也指矢量中的元素或信号中的某些频率成分。3.1.43
perceptual weightingfilter
感知加权滤波
利用共振峰处的噪声掩蔽特性,在共振峰区域分配比较大的失真,来减少峰谷主观感觉噪声的滤波。
功率谱powerspectrum
信号通过傅立叶变换后得到幅度谱的平方。3.1.45
光栅扫描
raster scan
矩形二维图像到一维图像的映射过程,一维图像的第一组值来自于二维图像最上边一行的从左到右扫描,然后依次是第二行、第三行等。对于图像每行(由上到下)都是从左到右扫描的。3.1.46
macroblock
一个16×16的亮度样点块和相应的两个色度样点块。4
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。