首页 > 国家标准(GB) > GB 8056-1987 数据的统计处理和解释指数样本异常值的判断和处理
GB 8056-1987

基本信息

标准号: GB 8056-1987

中文名称:数据的统计处理和解释指数样本异常值的判断和处理

标准类别:国家标准(GB)

英文名称:Statistical interpretation of data--Detection and handling of outlying observations in exponential sample

标准状态:已作废

发布日期:1987-07-08

实施日期:1988-04-01

作废日期:2009-01-01

出版语种:简体中文

下载格式:.rar.pdf

下载大小:295176

标准分类号

标准ICS号:社会学、 服务、公司(企业)的组织和管理、行政、运输>>质量>>03.120.30统计方法的应用

中标分类号:综合>>基础学科>>A41数学

关联标准

替代情况:被GB/T 8056-2008代替

出版信息

出版社:中国标准出版社

页数:11页

标准价格:12.0 元

出版日期:1988-04-01

相关单位信息

首发日期:1987-07-08

复审日期:2004-10-14

起草人:费鹤良、徐锦龙、陈振民

起草单位:上海师范大学

归口单位:全国统计方法应用标准化技术委员会

提出单位:全国统计方法应用标准化技术委员会

发布部门:国家标准局

主管部门:国家标准化管理委员会

标准简介

本标准规定了在来自指数分布(单参数)的随机样本中判断和处理异常观测值的一般原则和实施方法。适用于来自指数总体或近似指数总体的样本,即除了个别或少数草常值外其余大部分数据(主体数据)来自同一个指数总体或近似指数总体。 GB 8056-1987 数据的统计处理和解释指数样本异常值的判断和处理 GB8056-1987 标准下载解压密码:www.bzxz.net
本标准规定了在来自指数分布(单参数)的随机样本中判断和处理异常观测值的一般原则和实施方法。适用于来自指数总体或近似指数总体的样本,即除了个别或少数草常值外其余大部分数据(主体数据)来自同一个指数总体或近似指数总体。


标准图片预览






标准内容

中华人民共和国国家标准
数据的统计处理和解释
指数样本异常值的判断和处理
Statistical interpretation of dataDetection and handling of outlying observationsin exponential sample
1目的和应用范围
UDC 519.28
GB 8056--87
1.1本标准规定了在来自指数分布(单参数)的随机样本中判断和处理异常观测值的-般原则和实施方法。适用于来自指数总体或近似指数总体的样本,即除了个别或少数异常值外,其余大部分数据(主体数据)来自同个指数总体或近似指数总体。指数分布的分布函数为:F(α)=
概率密度函数为:
f(α)=
(2)
1.2异常观测值(或称异常值)是指样本中的个别值,其数值明显偏离它(或它们1)所在样本的其余观测催。
1.2.1异常值可能仅仅是数据中固有的随机变异性的极端表现,确是这样,就应把它和样本巾其它观测值以同样的方式对待。1.2.2异常值也可能是偶然偏离所规定的试验条件和试验方法的后果。或是在计算或记录这个数值时出现的失误。这种异常值与其它观测值不属」同个总体。2引用标准
GB3358-82《统计学名词及符号》GB4086.14086.6--83《统计分布数值表》3符号及其意义
一观测值中自小到大的第:个观测值。Tn(n) -
样本大小n100时,检验最大的观测值X(n)是否为异常值时所用的统计量。Tn(1)——样本大小n≤100时,检验最小的观测值X(1)是否为异常值时所用的统计量。En《n)———样本大小n>100时,检验最大的观测值X(n)是否为异常值时所用的统计鼠。En(1)
样本大小n>100时,检验最小的观测值X()是否为异常值时所用的统计量-检验的显著性水平。
(n)(1α)—显性水为α时,用统计量()作检验时的临界值。Tn()(a)
显著性水平为α时,用统计量T(1)作检验时的临界值。。(,)—自由度为和的F变鼠的分位数。Ein,r(1)-
一建数截尾样本中,判断(1)是否为异常小时所用的统让鼠。国家标准局1987~07-08批准
1988-04-01实施
4判断异常值的统计学原则
GB8056-87
判断个观测值是否为异常值时,通常可根据技术上或物理上的理由直接作出决定,例如当实验者已经知道实验偏离规定的实验方法,或测试仪器发生问题等等。当上述理由不明确时,可用统计方法。4.1本标准在下述不同情况下判断样本的异常值:单侧情形a):根据以往经验,异常值都为高端值;单侧情形b):根据以征经验,异常值都为低端值;双侧情形:异常值是在两端都可能出现的极端值。4.2执行本标准时,应规定在样本中检出异常值的个数的上限(占样本观测值个数的较小比例),当超过了这个「限时,对此样本的代表性,应作慎重的研究和处理。4.3判断单个异常值的检验规则
4.3.1将所有观测值假设为来自同-总体的样本诸值,作为原假设,选定与实际情况相符的4.1中的种情况作为备择假设,而后根据统计学原理构造判断异常值的统计量。4.3.2指定适当的显著性水α,推荐的α值为1%,而不宜采用超过5%的α值。根据α及观测值的个数n,确定统计量的临界值。4.3.3将该批数据代入统计量,所得统计量的值超过临界值时,则判断事先待查的极端观测值为异常;否则就判断没有异常值。4.4判断多个异常值的检验规则
在允许检出异常值的个数可大子1的情况,本标准规定的方法是重复使用同一种判断单个昇常值的检验规则,即用指定的显著性水平和符合4.3规定的检验规则检验全体观测值,者没有检出异常值,则整个检验停山;若检出了·个异常值,就再用相同的显著性水平和相同的规则,对除去已检出的异常值后余下的观测值继续检验,直到没有检出异常值,或检出的异常值个数达到上限为止。5处理异常值的一般规则
5.1对于用统计方法检出的异常值,应尽可能寻找其技术上的和物理上的原因,作为处理异常值的依据。
5.2处理异常值的方式有:
a。异常值保留在样本中参加其后的数据分析;b。允许剔除异常值,即把异常值从样本中排除,c。允许剔除异常值,并追加适宜的观测值计人样本;d。在找到实际原因时修正异常值。5.3标准使用者应根据实际问题的性质,权衡寻找产生异常值原因的花费,正确判断异常值的得益及错误剔除正常观测值的风险,确定实施下述“个规则中的一个:a:对仟何异常值,特无充分的技术上或物理上的原因,则不得剔除或进行修正。b。异常值中除有充分的技术上或物理上的理由者外,在统计上表现为高度异常的(即本标准规定的显著性水α下,为显著的观测值),才允许剔除或进行修正。5.4被剔除或经修正的观测值及其理由,应予记录,以备查询。6判断单个异常值的规则
6.1本标准规定,当样本大小n100时,使用统计量T(n)(或7(1))进行检验,当样本大小n100时,使用统量En(n)(或En(1))进行检验。6.2单侧情形a)的检验规则
6.2.1当样本大小n100时,按下法实施:a.计算统计量Tn(n)的值:
GB 8056—87
·(3)
b.确定显著性水α,在表A,1中查出对应于n,α的临界值T,(n)(1-α)。当Tn(n)的值大于临界值T,(n)(1-α)时,判X(n)为异常值,否则就判为没有异常值。6.2.2当样本大小n>100时,按下法实施:a,计算统计量E,(n)的值:
(n-1)【X(n) -.
(4)
2, X, -(X(m-X(n 1)
b。确定显著性水半α,在F变量的分位数表中,查出对应于n,α的临界值F1-α(2,2n-2)。当En(n)的值大于F,-α(2,2n-2)时,判X(n)为异常值,否则就判为没有异常值。6.3单侧情形b)的检验规则
6.3.1当样本大小n<100时,按下法实施:a.计算统计量T(1)的值:
(5)
b.确定显著性水平α,在表A2中查出对应于n,α的临界值Tn(1)(α)。当Tn(1)的值小于临界值T,(2)(α)时,判X(1)为异常值,否则就判为没有异常值。6.3.2当样本大小n100时,按下法实施:计算统计量En(1)的值:
n(n-1) X(1)
≥ x -n a)
确定显著性水平α,在F变量的分位数丧中,查出对应」n,α的临界值Fα(2,2n一2)。b.
当En(1)的值小临界值Fα(2,2n-2)时,判X(1)为异常值,否则就判为没有异常值。6.4双侧情形的检验规则
6.4.1当样本大小n≤100时,按下法实施:a.
计算统计量Tn(n),Tn(1)的值。号的临界值Tn(n)(1-
b.确定显著性水平α,在表A1中查出对应子n,套出对应n,
号的临界值Tn(n)(
计算样本均值:
有异常值。
≥1,Tn(), Tn(n)T'n(n) (1 -
-),在表A2
)时,判X(1)为异常值,
)时,判X(n)为异常值,否则就判为没2
GB 8056-87
6.4.2当样本大小n>100时,按下法实施:a.计算统计量En(n),En(1>的值。的临界值Fα(2,2n-2)
b.确定显著性水平α,在F变量的分位数表中,查出对应于n,和F,
(2,2n-2)。
c.计算样本均值:
为没有异常值。
6.5示例
>1,En(1)F
(2,2n2)时,判X(n)为异常值,否则就判例1.从指数总体中抽取样本大小为15的样本,经测量后得到观测值如下:0.21500.38931.48491.03490.29840.60045.1020 0.13811.2349 2.31820.4893 0.8682 0.7254 0.0667 1.8182其中最大的观测值X(15>=5.1020偏离其它观测值较大,问5.1020是否为异常值,取α=0.01进行判断。样本大小n=15,计算得T15(15)=0.3040。由表A1查得T15(15)(1 - 0.01)= 0.407 0
因为T15(15)因为E1ol(1)当样本中可能有多个异常值需要检验时,按照4.4的规则执行,具体判断异常值的方法,可根据单侧情形a),b)和双侧情况分别按6.2,6.3和6.4的步骤实施。8定数截尾(右边)样本中最小的观测值X(1)是否为异常小的统计判断准则8.1定数截尾(右边)样本。从总体中抽取n个个体,按数值由小到大的次序排列,取其前r个观测值:
X(1) X (2) s1GB 8056-87
8.2判断定数截尾样本中最小观测值X(2)是否为异常小时,按下法实施:8.2.1计算统计量En,1)的值。
En, r(1)=-
n(r-1)X()
X(o) +(n-r) X(n)-nXa)
8.2.2确定显著性水平α,在F变量的分位数表中,查出对应于r,α的临界值F。(2,2r-2)。当En,(1)小于F。(2,2r-2)时,判X(1)为异常小,否则判X(1)为非异常值。288
GB 8056—87
附录A
(补充件)
Tn(n)的临界值表
GB 8056--87
续表A1
2.4868×10~2
8.2006×10-
4.1005×10**
2.5468 × 10~4
1.6554 × 10~-
1.1716×10*
8.914×10
GB 8056--87
续表A1
Tn(1)的临界值表
5×103
1.6709 ×10 -
8.3612×10-
5.0189 ×10-4
3.3467×10
2.3909×10-+
1.7934 ×101
1.2496×102
4.1999×10*
2.0983×10-3
1.2601×10*
8.4336 ×10-
6. 0283 × 10 1
4.5074×10
8.4402 × 10
4.2381 × 103
2.5483 ×10
1.7010×10
1.2161×103
9.1260 × 10
6.961×10-5
5.526×10
4.537×10
3.778×105
3.173×10-5
2.710 ×10-5
2.393×10
2.116×10~
1.842×10~5
1.626×10~5
1.459×10-3
1.298 ×10 ~-3
1.199×10*5
1.087×10-3
9.85 ×10 6
9.12×10~6
7.63 ×10-1
7.06×10-h
6.63×10-6
6.13×106
5.77 ×10 ~6
5.33×10#
5.07×10-#
4.77×10*
4.49×10-6
4.14×106
4.02×10-6
3.70×106
3.60×10*6
3.39×10-6
3.23×10-6
3.03×10*
2.78 ×10 ~h
2.65×10 *t
2.48×10#
2.43×10*
2.31×10h
GB 8056--87
续表A2
1.3950×10+
1.1161×10 +
9.1321×10-5
7.6104×105
6.4398 ×10-5
5.5200×10
4.7842 × 10
4.1862×10-www.bzxz.net
3.6938×105
3.2835×10-5
2.9379×10-5
2.6441×10-5
2.3923×10~5
2.1749×105
1.9858×10-5
1.8203×10-5
1.6747×10-3
1.5459×10-5
1.4314×10-5
1.3292×10-5
1.2375×10:3
1.1550×10 3
1. 0805 ×10-3
1.0130×10-5
9.5159×10-#
8.9562×10-6
8.4444×10 h
7.9753 ×10-6
7.5442×10 -6
7.1472 ×10-6
6.7807 × 10-G
6.4417 × 10-6
6.1275 ×10-6
5.8357×106
5.5643 ×10-6
5.3114×10
5.0753×10t
4.8547×10*b
4.6481×106
3.5029×10
2.8063×10
2.2966 ×10**
1.9164×10 1
1.6201×10
1.3953×10
1.2089×10-
1.0537×10
9.333×10-5
8.290×10-5
7.398 × 10-5
6.658 ×10-5
6.026×10-5
5.474×103
4.982 ×10-5
4.572×10~5
4.206×10-5
3.887 ×10-5
3.603×10-
3.356×10-5
3.126×105
2.902×10-5
2.727×10~5
2.553×105
2.399×10~5
2.254×105
2.132×10~5
2.016×105
1.906×10-5
1.802×10-5
1.703×10-5
1.622×105
1.539×10*3
1.473×105
1.402×10-5
1.342×105
1.273×10*
1.222×10*3
1.169×10-3
7.1013 × 10
5.6830×10
4.6511×101
3.8768 ×10
3.2810 ×10
2.8128×10
2.4381 × 10 *
2.1336×10 4
1.8828 × 10 **
1.6737 ×10-4
1.4977 ×10
1.3480 ×10-
1.2197×10--
1.1089×104
1.0125×10-4
9.2819×10-
8.5398×105
7.8832×10
7.2995×105
6.7784 × 10-5
6.3111×10-5
5.8906 × 10~ 5
5.5107×10~5
5.1664 × 10~5
4.8534×10-5
4.5680×10-5
4.3701×10-5
4.0679×10
3.8481 ×10-5
3.6456×10~-5
3. 4588×10
3.2859×10~3
3.1256×10*5
2.9768×10 5
2.8384 × 10 5
2.7094×103
2.5891 ×10
2.4765 ×10**
2.3712×10
2.20×10-
2.12×10-6
2.08×106
1.94×10-6
1.90×106
1.81×106
1.78×10-6
1.66×10 6
1.63×10-6
1.55×10-6
1.49×10-6
1.46×10-6
1.44×10-6
1.35 ×10-6
1.34 ×10-6
1.27×10-6
1.23×106
1.21×106
1.14×10-6
1.13 ×10-6
1.11×10-6
1.05×106
1.04×10-6
9.9×10-7
9.1×10-7
9.0×10-7
8.5×10-7
8.4×10-7
7.9×10-?
7.8 ×10-7
7.7×10-7
7.5×10-7
7.2×10-7
7.1 ×10-7
7.0 ×10 7
6.7×10-?
GB 8056—87
续表A2
4.4545×10-t
4. 2727 × 10-6
4.1018×10-6
3.9409 ×10-6
3.7893 ×10~6
3.6464 ×10-6
3.5113×10-6
3.3836×106
3.2628×10-6
3.1483×10-6
3.0398×10-6
2.9367×10-6
2.8388 ×10-6
2.7458 ×10-6
2.6572×10-6
2.5728×10-6
2.4924×10-6
2.4158 ×10-6
2.3426×10-6
2.2726×10-6
2.2058×10-6
2.1419×10-h
2.0807×106
2.0221 ×10-b
1.9659×10-6
1.9120×10-6
1.8604×10-6
1.8107×10-6
1.7631×10-6
1.7173 × 10-6
1.6733×10*6
1.6309×10~6
1.5901×10-6
1.5509×106
1.5131×10-6
1.4766 ×10-6
1.4414×10-6
1.4075×10
1.3748 × 10 -6
1.124 ×10-5
1.079×10-5
1.033×10-3
9.91 ×10~6
9.54 ×10 6
9.17×10-6
8.86×10-6
8.50 ×10-6
8.21 ×10-6
7.95×106
7.68 ×10-6
7.41 × 10~6
7.16 × 10-6
6.92×10-6
6.68×106
6.50×10-6
6.27×10-6
6.10×10-6
5.89 ×106
5.73×10-6
5.53×106
5.38×10~6
5.22×10-6
5.08 ×10-6
4.94×10f
4.81×10-6
4.68×10~6
4.57×10-6
4.45 ×10-6
4.31×10-6
4.20×10-6
4.11×10-6
3.99×106
3.89×10~6
3.82×10-6
3.72×10~6
3.63×10-6
3.55×106
3.46×10-6
2.2724 × 10~5
2.1797 ×10 3
2.0925×10~5
2.0105×10-
1.9332×10
1.8602×10-5
1.7914× 10-3
1.7262×10-5
1.6646×10
1.6062×10~3
1.5508×10~3
1.4983×10-5
1.4483×105
1.4009×105
1.3557 × 10-5
1.3126×10-5
1.2716×10-5
1.2325 ×10-5
1.1952×10 5
1.1595 ×10~
1.1254 ×10-5
1.0928 ×10-3
1.0616×10-5
1.0317×10
1.0030×10-6
9.7555×10~6
9.4919×10-6
9.2388 ×10#
8.9957×10 6
8.7621×10h
8.5375×10-6
8.3214×10-6
8.1134×10 6
7.9131 × 10 t
7.7201×10-6
7.5341×10-6
7.3548×10~6
7.1817×10-6
7.0147 ×10 h
附加说明:
6.7×10-7
6.6×10~7
6.4×10-7
6.1×10-7
6.0×10-7
6.0×10-7
5.9×10-7
5.7×10-7
5.5×10-7
5.4×10-7
5.4 ×10-7
5.3×10-7
5.1×10-7
5.0×10-7
GB8056—87
续表A2
1.3432×10-6
1.3127×106
1.2832×10~6
1.2547 × 10-6
1.2271×10-6
1.2004×10-6
1.1746 × 10-6
1.1496×10-6
1.1254×10 6
1.1020×10~6
1. 0792×10-6
1.0572×10-6
1.0359×10-6
1.0151×10-6
本标准由全国统计方法应用标准化技术委员会提出。本标准由上海师范大学起草。
本标准起草人费鹤良、徐锦龙、陈振民。294
3.38×10-6
3.29×10-6
3.22×10-6
3.16×10-6
3.09×10-6
3.01×106
2.94×10~6
2.89 ×10-6
2.83 ×10-6
2.77×10-6
2.72 ×10~6
2.66×10~6
2.61 ×10-6
2.55×10-6
6.8535×10-6
6.6978 × 10-6
6.5473×10-6
6.4018×10 6
6.2611×10-6
6.1250×10-6
5.9933 ×10-6
5.8658 ×10 -6
5.7424×106
5.6337×10
5.5068×10**
5.3945 ×10-6
5.2855×10~6
5.1798 × 10-6
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。