首页 > 国家标准(GB) > GB/T 4882-2001 数据的统计处理和解释正态性检验
GB/T 4882-2001

基本信息

标准号: GB/T 4882-2001

中文名称:数据的统计处理和解释正态性检验

标准类别:国家标准(GB)

英文名称:Statistical interpretation of data--Normality tests

英文名称:Statistical interpretation of data--Normality tests

标准状态:现行

发布日期:2001-03-05

实施日期:2001-09-01

出版语种:简体中文

下载格式:.rar.pdf

下载大小:KB

标准分类号

标准ICS号:社会学、 服务、公司(企业)的组织和管理、行政、运输>>质量>>03.120.30统计方法的应用

中标分类号:综合>>基础学科>>A41数学

关联标准

替代情况:GB/T 4882-1985

采标情况:idt ISO 5479:1997

出版信息

出版社:中国标准出版社

书号:155066.1-17701

页数:33页

标准价格:19.0 元

出版日期:2004-04-03

相关单位信息

首发日期:1985-01-29

复审日期:2004-10-14

起草人:梁小摘、孙山泽、茹诗松、刘文

起草单位:华东师范大学、中国标准研究中心、北京大学

归口单位:全国统计方法应用标准化技术委员会

发布部门:国家质量技术监督局

主管部门:国家标准化管理委员会

标准简介

本标准在假定观测值相互独立时,对决定分布是否为正态的假设应否被拒绝的方法和检验,给出了一个导引。当对观测值是否服从正态分布存在疑问时,使用偏离正态分布的检验是有用的,甚至是必须的。利用t检验检查一个随机观测样本的均值是否偏离给定的理论值,就是这种情况的一个例子。然而,在稳健方法(即观测值的真实的概率分布不是正态时。结论仅有轻微的变化)的情况下,偏离正态分布的检验并不是非常必要的。涉及基于正态性假设的统计方法时,也并非严格地必须使用这样一个检验。观测值的正态分布可能是完全没有疑问的。可以是理论的(如物理的)原因构成了这个假设,也可以是根据先验信息接受了这个假设。本标准中偏离正态分布的检验是针对非分组的原始数据,而不是分组数据。检验也不适用于截尾数据。本标准中偏离正态分布的检验可以应用于观测值,也可以应用于它们的函数,如取对数、平方根等。当样本容量小于8时,偏离正态分布的检验效果是非常差的。因此,本标准限制样本量至少为8。 GB/T 4882-2001 数据的统计处理和解释正态性检验 GB/T4882-2001 标准下载解压密码:www.bzxz.net
本标准在假定观测值相互独立时,对决定分布是否为正态的假设应否被拒绝的方法和检验,给出了一个导引。 当对观测值是否服从正态分布存在疑问时,使用偏离正态分布的检验是有用的,甚至是必须的。利用t检验检查一个随机观测样本的均值是否偏离给定的理论值,就是这种情况的一个例子。然而,在稳健方法(即观测值的真实的概率分布不是正态时。结论仅有轻微的变化)的情况下,偏离正态分布的检验并不是非常必要的。 涉及基于正态性假设的统计方法时,也并非严格地必须使用这样一个检验。观测值的正态分布可能是完全没有疑问的。可以是理论的(如物理的)原因构成了这个假设,也可以是根据先验信息接受了这个假设。 本标准中偏离正态分布的检验是针对非分组的原始数据,而不是分组数据。检验也不适用于截尾数据。 本标准中偏离正态分布的检验可以应用于观测值,也可以应用于它们的函数,如取对数、平方根等。当样本容量小于8时,偏离正态分布的检验效果是非常差的。因此,本标准限制样本量至少为8。


标准图片预览






标准内容

ICS03.120.30
中华人民共和国国家标准
GB/T 48822001
idtIS05479:1997
数据的统计处理和解释
正态性检验
Statistical interpretation of data-Normality tests
2001-03-05发布
2001-09-01实施
国家质量技术鉴督局发布
GB/T 4882- --2001
ISO前言
ISO引
引用标准
定义与符号
图方法
有方向检验
利用6,和b的联合检验(多方向检验)无方向检验·
使用几组独立样本的联合检验
19统计用表
附录A(提示的附录)
附录R(提示的附录)
空的正态概率纸
参考文献
++7+中
GB/T 4882—2001
本标准等同采用国际标准ISO5479:1997《数据的统计处和解释偏离正态分布的检验。本标准代替国家标准GB/14882—1985.本标准与GB/T4882—1985相比,在检验方法方面的不同之处有:对图方法作了一些改进;
增加了利用儿组独立样本的联合检验,它实际上是一种修收的夏皮洛一威尔克(Shapiro-Wilk)检验
剧去了无方向检验中的D检验方法,代之以爱泼斯一普利(Epps-Puliey)检验方法。木标准的阴录 A,附录 B 为提示的附录。本标准于 1985 年 1 月 29 日首次发布。本标准出全国统计方法应用标准化技术委员会提出并归口。本标准由华东师范大学,中国标准研究中心、北京大学等单位起草。本标王要起草人梁小筠、孙山泽、萌诗松,刘文。CB/T 4882--2001
ISO前言
ISO(国际标准化组织)是由各国标准化团休(ISO成员团体)组成的世界性的联合会。制定国际标准的工作,通常由[S()的技术委员会完成,各成员团体若对某技术委员会的工作感兴趣,均有权参如该委员会。与ISO保持联系的各国际组织(官方的或非官方的)也可以参如有关丁作。在电工技术标准化方面,ISO与国际电工委员会(IEC)保持密切合作关系。由技术委员会采纳的国际标准草案提交各成员团体投票表决,需取得至少75%参加表决的成员团体的同意才能作为国际标准正式发布。国际标1SO5479是由ISO/TC69/SCG统计方法应用技术委员会测试方法与结果分委员会制订的。
本国际标雅的附录A,附录B供参考ISO引言
国际标准中推荐的诈多统计方法。如ISO2854中描述的那些方法,有一个基本的假定:在这些方法中涉及的随机变量具有独立的正态分布,分布的一个或两个参数可以是末知的。这就引出了一个问题,为了能可靠地应用那些国际标准提供的方法,由样本代表的分布是否充分接近正态分布?
在任何情况下,这个间题都不能简单地用\是”或“否”来回答。因此·发展了大量的“正态性检验”方法,这些方法中的每一个方法对所考虑的分布的某一特征(如偏度、峰度)或多或少是灵敏的。一般,使用的检验是对应于某种预先确定的风险设计的,此风险即如果正态性是真时被拒绝(第一类错误)。另一方面,当假设不真时,除非备择假设被明确地给定,原假设未被拒绝(第二类错误)的概率是不能确定的。然而明确给定备择假设通常是不可能的。因此,需要计算结果。对某一特殊的检验,如果样本量较小,这个风险会特别大。1范围
中华人民共和国国家标准
数据的统计处理和解释
正态性检验
Statistical interpretation of data-Normality tests
GB/T 48B2—2001
idtISO5479:1997
代替GB/T4882—1985
1.1木标在假定观测值相互独立时,对决定分布是否为正态的假设应否被拒绝的方法和检验,给出了个导引。
1.2当对观测值是否服从正态分布存在疑问时,使用偏离正态分布的检验是有用的,甚至是必须的,利用t检验检查一个随机观测样本的均值是否偏离给定的理论值,就是这种情况的一个例子。然而,在稳健方法(即观测值的真实的概率分布不是正态时,结论仅有轻微的变化)的情况下,偏离正态分布的检验并不是非常必要的。
1.3涉及基丁正态性假设的统计方法时,也并非严格地必须使用这样一个检验。观测值的正态分布可能是完全没有疑问的,可以是论的(如物理的)原因构成了这个假设,也可以是根据先验信息接受了这个假设,
1.4本标准中偏离正态分布的检验是针对非分组的原始数据,而不是分组数据。检验也不适用于截尾数据。
1.5本标准中偏离正态分布的检验可以应用于观测值,也可以应用于它们的函数,如取刘数,平方根等。
1.6当样本容量小于8时,偏离正态分布的检验效果是非常差的。因此,本标准限制样本量至少为8。2引用标准
下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。GB/T3358.1一1993统计学术语第一部分一般统计术语3定义与符号
3. 1 定义
在GB/T3358.1中的定义适用于本标准。3.2.符号
夏皮韬一威尔克捡验的系数
爱泼斯:普利检验的辅助量
(即国际标准中的62)样本峰度
(即国际标准中的/b.)样本偏度
国象质量技术监督局2001-03-05批准2001-09-01实施
GB/T4882-2001
爱泼斯一普利检验的辅册量
利用几组独立样本的联合检验的辅助量利用几组独立样本的联合检验的样本组数零假设
备择假设
在按非降次序排列的样本内,观察值戈的个数样本阶中心矩
样本量
与分布的力分位数相联系的概率概率
与 X相联系的概率
夏皮洛一威尔克检验的辅助量bzxz.net
检验统计量
爱泼斯·普利检验的检验统计量标准正态分布的力分位数
利用几组独立样本的联合检验的辅助量夏皮洛一威尔克检验的检验统计量利用几组独立样本的联合检验的辅助量X的值
随机变量
在按非降次序排列的样本中,样本的第;个值在按非降次序排列的样本中,样本的第个值算术平均
显著性水平(犯第一类错误的概率)犯第二类错误的概率
(即国际标准中的8)总体的峰度
总体的峰度相对于正态分布而言的超出量(即国际标准中的√β,)总体的偏度利用儿组独,立样本的联合检验的辅助量利用几组独立样本的联合检验的系数利用儿组独立样本的联合检验的辅助量利用几组独立样本的联合检验的系数利用儿组独立样本的联合检验的辅助望利用儿组独立样本的联合检验的系数总体的期望
总体的方差
总体的3阶中心矩
总体的4 阶中心矩
总体的标准差(—)
4总则
GB/T4882—2001
4.1检验偏离正态分布有多种方法。在本标推中有图方法、矩检验、回归检验和特征函数检验。拟合优度检验仅适用于分组数据,由于分组会损失信息,本标准不考虑这种检验。4.2如果没有关于样本的附加信息可以利用,则建议先做一张正态概率图。也就是在正态概率纸上画出观察值的累积分布函数,止态概率纸上的坐标轴系统使正态分布的累积分布函数呈一条直线。在第5章中描述了这一方法,它让人们立即看到观测的分布是否接近正态分布。有了这种进一步的信息,可决定是进行一个有方向检验,还是进行回归检验或特征函数检验或者不再检验。另外,这样的图示虽然不能作为一个严格的检验,但它提供的直观的信息,对于任何一种偏离正态分布的检验都是一种必要的补充。在拒绝零假设的情形,按这些信息的意义,常常可以看出恰当的备择假设的类型。4.3一个偏离正态分布的检验是对如下的零假设所作的检验:组成样本的个独立观测值来自同止态分布。检验包含计算一个称为检验统计量的观测值的丽数T,正态分布零假设拒绝与否,取决于T的值是否落在与正态分布对应的期望值附近的一个集合中。4.4检验的拒绝域是导致拒绝零假设的T值的个集合。检验的显著性水平是一个概率,它是当零假设正确时,T值落人拒绝域的概率。这个水平给出了错误地拒绝零假设(犯第一类错误)的概率。拒绝域的边界(在双侧检验时,拒绝域的两侧边界)是检验统计量的临界值。4.5检验的功效是当零假设不真时,拒绝零假设的概率,功效高意味着错误地不拒绝零很设(犯第二类错误)的概率低。
应该强调,检验的功效(即正态分布零假设是错误时,零假设被拒绝的概率)会随观测数的增多而增大,例如,当使用某一个偏离正态分布的检验时,在大的样本下,检验出与正态分布有偏离是容易的,而同一检验在较少的观测值下而能检验不出偏离。4.6偏离正态分布的检验根据备择假设的不同可分为两种。当在备择假设中指定对正态分布偏离的形式时,检验称为有方向检验。当在备择假设中未指定对正态分布偏离的形式时.检验称为无方间检验。在有方向的检验中,确定拒绝域应使检验的功效尽可能地大。在无方向的检验中,拒绝域包含检验统量远离其在零假设下希望的值的那些值。如果关于偏离止态分布的形式的假设已有设定,例如与正态分布具有不同的偏度或峰度,应该使用有方向检验,因为这样的检验的功效-一般比无方向检验高。4.7注意:有方向检验基本上是单侧的,例如,在偏度的情形,它或是正偏或是负偏。然而,当几个备假设联合考虑时,检验是多方向的,当非零偏度和不同于正态分布的峰度一一起考虑时,就是这种情况。4.8表8至表14及图9允许检验在最常用的α水平,即α=0.05和α=0.01下执行。显著性水平必须在执行检验前给定。注意检验可能产生这样的结果,在0.05水平下拒绝零假设,而在.()1水平下不拒绝这同个零假设。
4.9在计算检验统计量时,必须至少保持6位有效数字。部分和中间结果和辅助量的归整不应少于6位有效数宁。
5图方法
5.1在正态概率纸上画出观测值的累积分布函数。这种概率纸,一个坐标轴(在本标准中为纵轴)的刻度是非线性的,它是按标准正态分布函数的值刻画的.对具体数据则标出其累积相对频率的值。另一个坐标轴刻度是线性的,顺序标山X的值。正态变量X的观测值的累积分布函数应近似一条直线有时这两个坐标轴被相对调。另外,如果对变量X作了一个变换线性刻度可以变成对数、平方、倒数或其他刻度,
图1给出了一张正态概率纸。在纵轴I累积相对频率的值是百分数,而横轴是线性刻度。附求A提供广一张空白的正态概率纸。3
GB/T 4882 - 2001
如果在正态概率纸上所绘的点散布在·条直线附近,则它对样本来自正态分布提供了·个粗略的支持。而当点的散布对直线出现系统偏差时,这个图可提示一种可供考虑的分布类型。这种方法的重要性在于它容易提供对正态分布偏离的类型的视觉信息。如果图形显示数据是来自某种形状的分布(如图5或图6中所显示的累积分布函数图),数据的某种变换可能导致正态分布。
如果图形显示数据不是来白一个简单的单:分布,而是求白两个或多个单一了总休的混合(如图7显示的繁积分布函数图),则建议先识别这些子总体,再分别分析每一个了总体。必须注意,这样,张图从严格意义上来说并不是一个检验偏离正态分布的方法。在小样本场合,表示的曲线可能呈现为正态分布,但是,在大样本场合,“些不显眼的曲线也可能是非正态分布的显示。99. 99
t -1. 96 m
图1有注释的正态概率纸
5.2图方法首先把观测俏按非降次序排列成(>2)然后在正态概率纸上对应闻出Pe= (k
注1:等式(1)也可以用下面两个式于代替:3/8)/(n + 1/4)
1/2)/n
P= k/(n + 13)
它们是对正态分布函数F在次序统计量的期望E(X:)处的值F(E(X())的较总的近仪.所以不推荐使用:5.3在图2中给出了如何使用正态概率纸的一个例子。4
GR/T 4882—2001
GB/T4882—2001
表1给出了按非降次序列出的15个独立的旋转弯曲疲劳试验的结果值(t)。表 115个旋转弯曲疲劳试验的结果值3(4)和相应的lg(10:))P_k-3/8
2:在表1及以后的例子中均省略观测值的单位,因为它们与这个标准中的检验方法无关:Ig(10.rtm)
第k个最小的买u)和相联系的概率P=(k一3/8)/(n+1/4)-起构成一系列点,它们画在图2a)上。从这个图立即可以看出这些点不呈一直线。然而,如果用1g(10t)代替工(,在新的图(图2b))1标出这一系列点,这时可以接受这些点接近一条直线的看法。所以观测值的对数值来自正态分布的假设似乎是适当的。5.4应该注意极端的观测值比中段的观测值有较大的离差,加之,累积相对频率的标度尺往极端的方向会变宽。所以,当累积分布的两端有个别值明显偏离由中段值确定的直线时,不能就认为这是偏离正态分布的标志。
样本量愈大,从图形获得的结论就愈可靠。如果在观测值的累积分布函数的图形中,较大的值显著地落在出其他值确定的直线的下方,作3一1g或y=等变换会使图更符合一直线[参看图2b)和图5]。在图3至图7中,上方图形所显示的累积分布函数,是与下方图形显示的案度函数相对应的。如果观测值的累积分布痫数的图如图3或图4,对应的密度函数分别是峰度不足的(低峰态的)或峰度过度的(高峰态的)。
如果观测值的累积分布函数的图如图5或图6,对应的密度函数分别是正偏的或负偏的。图7显示了两个不同密度函数叠加的累积分布函数和密度函数。6
图 3 具有低蜂度的密度数
GB/T4882—2001
图 4具有高峰度的密度函数
图5具有正偏度的密度函数
GB/T 4882 ---2001
图6具有负偏度的密度函数
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。