GY/T 298-2016

基本信息

标准号： GY/T 298-2016

中文名称：音频系统小损伤主观评价方法

标准类别：广播电影电视行业标准(GY)

标准状态：现行

出版语种：简体中文

下载格式：.zip .pdf

下载大小：7595887

标准分类号

关联标准

出版信息

标准简介

GY/T 298-2016.Methods for the subjective asssment of small impairments in audio systems.
1范围
GY/T 298规定了音频系统小损伤的主观评价方法。
GY/T 298适用于在电视节目或广播节目的收录、分配、传送和监测等环节，对小损伤节目( 与源节目对比，源节目须可获得)或产生小损伤的系统的声音质量进行主观评价，也适用于产生小损伤的编解码器等设备的研究和开发。
2规范性引用文件
下列文件对于本标准的应用是必不可少的。凡是注日期的引用文件，仅所注日期的版本适用于本标准。凡是不注日期的引用文件，其最新版本(包括所有的修改单)适用于本标准。
GB/T 6278- -2012 声系统设备概述模拟节目信号
GY/T 192- -2003数字音频设备的满度电平
GY/T 282- 2014 数字电视节目平均响度和真峰值音频电平技术要求( ITU-R BS. 1864: 2010, MOD)
ITU-R BS. 645用于国际声音节目链路的测试信号和电平计量(Test signals and metering to be used on internat ional sound programme connections)
ITU-R BS.708 演播室监听耳机电声特性测量( Determination of the electro-acoustical properties of studio moni tor headphones)
ITU-R BS. 775伴随和不伴随图像的多声道立体声声音系统(Multichannel stereophonic sound system with and wi thout accompanying picture)
ITU-R BS. 1284声音质量主观评价通用方法(General methods for the sub jective assessment of sound quality)
ITU-R BS.2051用于节目制作的先进声音系统(Advanced sound system for programme production)
3术语、定义和缩略语
3.1术语和定义
下列术语和定义适用于本标准。
3.1.1片段excerpt适于评价给定被测系统声音质量的个性特征或参数的一段音乐、语音或其他声音信号。测试片段通常为CD、R-DAT或其他格式的- -段声音信号。

标准图片预览

标准内容

中华人民共和国广播电影电视行业标准GY/T298—2016
音频系统小损伤主观评价方法
Methodsforthe subjectiveassessment of smallimpairments in audio systems(ITU-R BS.1116-3, MOD)
2016-03-18发布
国家新闻出版广电总局
2016-03-18实施
规范性引用文件
术语、定义和缩略语
测试设计
评价小组的选择
5.1专家评价员
5.2评价员的选择准则。
5.3评价小组大小
6测试方法
方法概述
熟悉或训练阶段
等级评分阶段
单声道系统
双声道立体声系统
多声道立体声系统
先进声音系统，
8节目素材
重放设备
基准监听扬声器
基准监听耳机
10听音条件
基准听音室
10.3基准声场条件
10.4听音声级
昕音安排
统计分析。
统计分析结果陈述
12.2绝对评分值
12.3评分差值
12.4显著性水平和置信区间
13测试报告内容
GY/T 2982016
GY/T 2982016
附录A（资料性附录）评价员后筛除的统计学考虑附录B（资料性附录）评价员专业技能等级评价......附录C（资料性附录）给评价员的主观评价指导书范例.：
..: 23
本标准按照GB/T1.1一2009给出的规则起草。GY/T2982016
本标准使用重新起草法修改采用ITU-RBS.1116-3《音频系统小损伤主观评价方法》。本标准与ITU-RBS.1116-3相比变化如下：
一第3章的3.1对应ITU-RBS.1116-3的附录4；一第8章中允许的节目素材最大电平由ITU-RBS.1116-3第6章中规定的“高于校准电平9dB修改为符合GY/T282一2014中规定的“最大真峰值音频电平应不超过-2dBTP”请注意本标准的某些内容可能涉及专利。本标准的发布机构不承担识别这些专利的责任。本标准由全国广播电影电视标准化技术委员会（SAC/TC239）归口。本标准起草单位：国家新闻出版广电总局广播电视规划院。本标准主要起草人：张建东、覃毅力、孙岩、工倩男III
GY/T2982016
考虑到：
ITU-RBT.500、ITU-RBS.1284、ITU-RBT.710和ITU-RBT.811建议书已经建立了些对视音频系统质量进行主观评价的方法：有用信号从源端传输至听众的过程中会产生损伤，一类主观听音测试是对损伤带给听众的“不悦”程度进行评价；
传统的客观测量方法不足以评价先进音频编码系统的声音质量，因此开发了感知质量客观评价方法：
使用标准化的方法有利于测试数据的兼容和交换，以及对测试数据的正确评估；一些利用心理声学特性的先进数字音频系统的新近出现，尤其是产生小损伤的数字音频系统的出现，需要主观评价方法的改进：ITU-RBS.775规定的多至3/2声道的多声道立体声系统和ITU-RBS.2051措述的先进声音系统（无论是否伴随有图像）的出现，需要包括测试条件在内的新的主观评价方法。建议：
使用本标准规定的测试、评价和报告过程对包括多声道在内的声音系统（无论是否伴随有图像）的小损伤进行主观评价。
进一步建议：
适用于先进声音系统的听音室和重放设备的特性有待于进一步研究，待研究完成时，应根据研究结果更新本标准。
1范围
音频系统小损伤主观评价方法
本标准规定了音频系统小损伤的主观评价方法，GY/T2982016
本标准适用于在电视节目或广播节目的收录、分配、传送和监测等环节，对小损伤节目（与源节目对比，源节目须可获得）或产生小损伤的系统的声音质量进行主观评价，也适用于产生小损伤的编解码器等设备的研究和开发。
2规范性引用文件
下列文件对于本标准的应用是必不可少的。凡是注日期的引用文件，仅所注日期的版本适用于本标准。凡是不注日期的引用义件，其最新版本（包括所有的修改单）适用于本标准。GB/T6278一2012声系统设备概述模拟节目信号GY/T1922003数字音频设客的满度电平GY/T282—2014数字电视节目平均响度和真峰值音频电平技术要求（TTU-RBS.1864：2010，MOD）ITURBS.645用于国际声音节目链路的测试信号和电平计量（Testsignalsandmeteringtobeusedon international soundprogrammeconnections)ITU-RBS.708演播室监听耳机电声特性测量（Determinationoftheelectro-acousticalproperties of studio monitor headphones)ITu-RBs.775伴随和不件伴随图像的多声道立体声声音系统（Multichannelstereophonicsounasystem with and without accompanying picture)ITU-RBS.1284声音质量主观评价通用方法（GeneralmethadsTorthesubjectiveassessmentof sound quality)
ITu-RBS.205l用于节目制作的先进声音系统（Advancedsoundsysteforprogramneproduction）3术语、定义和缩略语
3.1术语和定义
下列术语和定义适用于本标准。3.1.1
片段excerpt
适于评价给定被测系统声音质量的个性特征或参数的一段音乐、语音或其他声音信号。测试片段通常为CD、R-DAT或其他格式的一段声音信号。3.1.2
属性attribute
根据给定的口头或书面定义，听音测试活动中可感知的特征，1
GY/T2982016
小损伤
smallimpairments
必须通过严格控制的听音测试条件和适当的统计分析才能觉察到的相比于源素材市音的微小区别3.1.4
由被测系统处理过的一段片段。3.1.5
被测对象
object
被测系统，通常以经过该系统处理后的一些测试片段来代表。3.1.6
reference
未经被测对象处理过的测试片段，用作损伤测试对比的基准。3.1.7
hiddenreference
隐藏参考
未向评价员标识的参考。
刺激stimulus
被测对象条目、隐藏参考、参考与一个片段的部分或全部的组合。3.1.9
评价员subject
在听音测试中评价刺激的测试人员。3.1.10
评价小组
listeningpannel
在一个听音测试中，给出听音测试数据的评价员的整体。3.1.11
地点locatian
听音测试的执行位置，指听音室的地理位置或评价员在听音室内的位置，是测试要素之一。3.1.12
盲测 blind test
种测试方法，在该种测试中，刺激是向评价员提供的唯信息源。2
双言测试doubleblindtest
GY/T2982016
盲测的一种，在该种盲测中，听音测试的组织者和听音测试之间没有不受控制的交互可能。3.1.14
等级评分
根据给定的标度，一个属性量级的数字表示。3.1.15
一场测试
session
需要由一位评价员或一个评价小组在一个持续的时间段内评估的整组试验（试验定义见下条）。3.1.16
试验trial
一场测试的子集，该子集以一组刺激的重放为开始，以完成对它们的等级评分为结束。一些定义之间的关系说明见图1。听音谢试
地点1
场测试1
代验1
地点2
场测试2
试验2
试验入
地点xbZxz.net
场测试X
“代表详价员在参考，留靠参考和披测对象间所做的选择图1
片段片段片段。
一些定义间的关系
地点“
GY/T2982016
3.2缩略语
下列缩略语适用于本标准。
ANOvA方差分析（AnalysisofVariance）SQAM声音质量评价素材（SoundQualityAssessmentMaterial）4测试设计
在科学领域存在很多采集可靠信息的策略。音频系统小损伤的主观评价应采用最严谨的测试方法首先要严格把控测试条件，其次要把握好评价员的量化数据。主观测试需要仔细地设计和规划，以避免受到不可控因素的影响而产生歧义。例如，在听音测试中，如果音频条目的实际顺序对所有评价员都相同，则无法确定评价员所给出的判断是出于播放顺序还是出于不同的损等级。因此，必须以揭示独立因素且只包括这些因素影响效果的方式安排测试条件。在整个听音测试中：如果潜在损伤和其他特性预计呈均匀分布，则可以采用真正随机化的方式安排测试条件：如果预计呈非均匀分布，则必须考虑测试条件的安排方式。例如，如果待测素材的难易程度不同，则刺激的出现顺序在一场测试以及不同场测试间均应满足随机分布。听音测试的设计还应保证提供给评价员的信息量不过载，从而避免降低评价员判断的准确性。除非声音和图像间关系十分重要，音频系统主观评价首选无伴随图像的方式。测试设计中还有项重要考虑就是采用恰当的控制条件。比如，控制条件包括以评价员不可预测的方式出现的无损音频素材。正是从这些控制刺激与潜在损伤刺激之间的差异判断得出的等级评分才是真正对损价的评价。
有关测试设计的具体考虑见本标准的后续部分。测试设计、实施和统计分析问题十分复杂，因此，本标准只能给出诸如此类的最普遍的指导方针。建议在听音测试之初咨询实验设计和统计分析相关专家或请专家直接介入。
5评价小组的选择
5.1专家评价员
音频系统小损伤听音测试的评价数据应全部来自具备专业小损伤探察技能的专家。待测系统达到的质量越高，趣需要专家进行评价。5.2评价员的选择
5.2.1评价员的选择准则
小损伤市音系统的主观测试是基于一组经过选择的评价员，其结果主要不是用于外推到一般大众的听音情况，而是调查一组听测专家，在特定的条件下，能否感知相对微弱的质量下降并给出损伤的定量估计。对测试过程的严格控制是为了揭示被测系统一且投入使用后，消费者在长期不同条件下的实际生活的使用中可能会发现的问题。有时，需要在测前或测后使用一种筛除技术（测试之前称为预筛除，测试之后称为后筛除），有时，两种筛除技术都需要。这单，筛除是指种处理，筛除处理未通过的某个评价员的评价结果将全部被忽略。
任何种末经仔细分析和应用的筛除技术都有可能导致有偏差的结果，因此，一旦发生数据筛除报告中应清晰描述所用的筛除准则，以使读者做出自已的判断。4
5.2.2评价员的预筛除
GY/T2982016
预筛除方法包括：听觉测验，基于以往测试中的经验和表现、基于预测试的统计分析结果。也可通过训练过程进行预筛除。
采用预筛除技术主要是为了提高听音测试的效率，但同时会限制结果的善适性，因此应在两者问逊行平衡。
5.2.3评价员的后筛除
后筛除方法大致分为两类：一类是基于个人评价结果与平均结果的不致性：另一类是基于评价员做出正确辨别的能力。第一类方法不够科学。若采用本标准规定的方法进行测试，将自动生成第二类后筛除方法所需要的信息。评价员后筛除的统计学考虑参见附录A。评价员专业技能等级评价方法参见附录B。
后筛除方法主要用来筛除不能做出正确辨别的评价员。应用后筛除方法需在测试结果中予以阐明。但是，评价员对不同类别的损伤的敏感度是不同的，筛除操作应谨慎。5.3评价小组大小
如果总体方差可估计且已知实验精度，则可以预测出评价小组的适当人数（样本容量）。经验表明，在听音测试条件从技术和操作双方面得到严格控制的情况下，20位评价员给出的数据通常足以得出适当的结论。如果在测试进程中可进行数据分析，那么当达到了得出适当结论所需的统计显著性，则无需更多评价员的继续参与。如果被测系统预期达到了近乎透明（几无损伤）的程度，则需要更多的评价员，以保证通过后筛除的评价员的数目足够多。
如果由丁某种原因测试条件未得到严格控制，则可能需要更多评价员的参与以达到测试所要求的精度。
评价小组的大小并不是实验精度的唯一制约因素。原则上，按照本标准进行的测试，其结果仅当实际参加测试的评价员为一组听测专家时才严格有效。在此前提下，通过增加评价小组的人数，可能使测试结果因有更多听测专家的参与而显得更具说服力。另外，考虑到存在评价员对不同类型的损伤敏感度不同的可能性，也需要增加评价员的人数。6测试方法
6.1方法概述
本标准采用“带隐藏参考的双盲三刻激”方法，此方法灵敏、稳定，有利于对小损伤的准确探察。此方法的推荐应用形式也是对损伤探察最为灵敏的形式为：每次只有一位评价员从三个刺激（“A”、“B”、“C”）中自行选择，进行评价。三个刺激中通常将已知参考作为“A”，隐藏参考和被测对象在每个试验中随机分配给“B”和“C”。测试时要求评价员按照连续五级损伤标度，分别评价“B”和“C”相对于“A”的损伤程度。三个刺激中，“B”和“C”其中之一应与“A”无区别，另一个刺激可能存在损伤，该刺激与“A”相比任何可感知的区别均被解读为损伤。在这种推荐形式的测试中，评价员一旦给出一个试验的评分就应该能够直接继续到下一个试验，而且在做出评价前片段可重复播放。由此，评价员可以自行控制测试进度。等级评分标度源于ITU-RBS.1281中规定的五级损伤标度，应视为“带支撑点”的连续标度，见表1。
GY/T2982016
损伤程度
损伤不可觉察
损伤可察觉，但不至引起不悦
损伤稍令人不悦
损伤令人不悦
损伤令人非常不悦
表1ITU五级损伤标度
评分等级
注：使用预定义的中间支撑点有可能引入偏差[Pculton,1992]，也可使用不带支撑点描述的数字标度，但必须标示标度的排列方向，这样，可以解决以不同语言进行的对比测试中对支撑点描述的翻译问题，如果不使用中间支撑点，必须将个体评价员的评价结果根据整体均值和标准偏差进行归一化处理式（1）可用于在保留原始标度的同时实现归一化Z,
式中：
归一化的结果；
评价员的评分；
一场测试s中评价员i的平均分；一场测试5中所有评价员的平均分：一场测试S中所有评价员评分的标准差：一场测试。中评价员1评分的标准差。使用无中间支撑点的评分标度时，不允许以绝对值的形式表示评价结果。建议评分标度精确到小数点后一位。测试方法包括两个部分：熟悉或训练阶段和等级评分阶段6.2熟悉或训练阶段
进行正式等级评分之前，评价员应（通过训练）完全熟悉测试工具、测试环境、等级评分过程、评分标度以及评价方法，还应完全熟悉待辨别的损伤。如果进行的是最灵敏形式的测试，评价员应在正式评分之前听过所有的测试素材。在熟悉或训练阶段，建议评价员组成小组（如3人一组），于自由讨论察觉到的损伤情况。
附录C给出了一套面向评价员的指导书示例，示例包括“带隐藏参考的双盲三刺激”方法描述等。通过正确的训练，可以将一些具备初级能力的评价员转变为适应测试的专家，并使其在随后的正式等级评分阶段所使用的评分标准趋于稳定。6.3等级评分阶段
在当大第一场正式等级评分测试开始时，应向评价员口头介绍主观评价指导书（最好辅以书面材料），还可以展示几个对比听音示例。中长期的听觉记忆并不可靠，测试过程应完全依赖于短期记忆。在评分阶段，最好采用如附录C所述的三刺激系统并结合准瞬时切换的方法，此类切换要求刺激在时间线上严格对齐。注：如果连续刺激的波形不一致，完全的瞬时切换可能产生人工噪声。因此，推荐使用包括渐弱/变换/渐强过程在内40ms的准瞬时切换时间。
在最严格的测试中，每次只能有一个评价员参与评价，以保障评价员拥有完全的自由度在三个刺激6
GY/T2982016
间随意切换，这种自由度对评价员运用自身判断力充分比较每个试验的刺激间的细微差别是必不可少的。为减少注意力的分散，评价员应能够在没有视觉引导的条件下切换刺激，如果评价员愿意，他完全可以闭上眼睛以集中精力。切换系统不应产生可闻干扰（如“味哒”声），否则将严重影响评价员的评价过程。
尽管本标准提倡的评价员自行控制试验速度会导致不同评价员的评分过程耗时不同，但一场等级评分测试不应超过20分钟～30分钟，即一场测试包含不超过10次～15次试验。评价员的疲劳是严重影响其判断准确性的主要因素。为避免评价员疲劳，连续两场测试间的休息时间不得少于场测试的时间。7属性
7.1概述
本章列出了单声道、双声道立体声、多声道立体声（多至3/2声道）和先进声音系统的评估属性。建议“基本音频质量”属性为必选属性，其余为可选属性。对每个试验，如果要求评价员对一个以上的属性做出评价，有可能给评价员造成应答负担。对一个给定的刺激，如果由于要求评价员回答多个问题而造成了负担过重，将导致对所有评价属性的评价结果的不可靠。
7.2单声道系统
基本音频质量
唯一的全程属性，用于判断参考与被测对象之间一切可察觉的差别7.3双声道立体声系统
基本音频质量
唯一的全程属性，用于判断参考与被测对象之间一切可察觉的差别。以下为可选的附加属性：
立体声声像质量
本属性与参考和被测对象在音频事件的声像位置，声像深度感和真实感方面的差别有关：虽然一些研究发现立体市市像质量有可能受损，但没有充足的研究结果支持将立体市像质量与基本音频质量的评价独立开来。
注：截止到1993年，大多数双声道立体声系统的小损伤主观评估研究只是使用了基本音频质量属性，而立体声声像质量属性一直是作为一个全程属性隐式或显式地包含于基本音频质量属性中。7.4多声道立体声系统
基本音频质量
唯一的全程属性，用于判断参考与被测对象之问一切可察觉的差别以下为可选的附加属性：
前方声源声像质量
本属性与前方声源的定位相关，它包括立体声声像质量和清晰度的损失。环绕声质量
本属性与空间感，环境感，或者特定方向的环绕效果相关：7
小提示：此标准内容仅展示完整标准里的部分截取内容，若需要完整标准请到上方自行免费下载完整标准文档。