GB 3359-1982
标准分类号
标准ICS号:社会学、 服务、公司(企业)的组织和管理、行政、运输>>质量>>03.120.30统计方法的应用
中标分类号:综合>>基础学科>>A41数学
相关单位信息
首发日期:1982-12-30
复审日期:2004-10-14
起草单位:电子工业部标准化研究所
归口单位:全国统计方法应用标准化技术委员会
发布部门:国家标准局
主管部门:国家标准化管理委员会
标准简介
本标准规定以样本为基础的确定统计容许区间的方法。本标准给出的方法仅适用于各抽样单位是从所考虑的总体中随机抽取的,而且是相互独立的;总体的特性遵从正态分布。 GB 3359-1982 数据的统计处理和解释 统计容许区间的确定 GB3359-1982 标准下载解压密码:www.bzxz.net
本标准规定以样本为基础的确定统计容许区间的方法。本标准给出的方法仅适用于各抽样单位是从所考虑的总体中随机抽取的,而且是相互独立的;总体的特性遵从正态分布。
标准内容
中华人民共和国国家标准
数据的统计处理和解释
统计容许区间的确定
Statistical interpretation of dataDetermination of a statistical tolerance intervalUDC 519 (083.4)
GB3359-82
本标准规定以样本为基础的确定统计容许区间的方法。统计容许区间是以给定置信水平至少包含总体中规定比例的区间。统计容许区间可以是双侧的或者是单侧的,区间的端点称为统计容许限,也称为过程的自然限。
1概论
1.1本标准给出的方法仅适用于各抽样单位是从所考虑的总体中随机抽取的,而且是相互独立的;总体的特性遵从正态分布。这里对正态性的要求比对均值和均值之差进行推断时更为重要。1.2当正态性假设被拒绝或有理由怀疑其有效性时,可以将变量变换成正态的,或者采用本标准附录A的引害中所叙述的方法。
采用其他方法确定非正态分布形式的统计容许区间是可能的,但本标准不给出这些方法,在附录A中仅给出了-~种简单的情形。
1.3在确定统计容许区间时,要给出与数据菜源和收集方法等有关的全部信息,特别是最小单位或者有实际意义的有效数字,这将有助于统计分析。1.4对于个别可疑的数据不能任意剔除或修正,除非有试验上、技术上或其他的明显理由才能剔除或修正。
在每种情况下,被剔除或修正的数据应予说明。1.5如1.1中所述,置信水平1-α是统计容许区间包含总体的比例至少为P的概率。此区间包含总体的比例少于p的风险是α。通常取1-α的值为0.95和0.99(即α=0.05和α=0.01)。如果许多样本在同一置信水平0.95下确定了许多统计容许区间(每一个样本确定一个区间),则包含总体的比例至少为所要求的比例的那些区间所占的比例接近于95%。1.6总体的标准差为已知(均值未知)的情形,使用表1和表2。均值和标准差都未知的情形,使用表3和表4。
当均值μ和标准差α都已知时,所研究的特性的分布(假定是正态的)是完全确定的,于是在μup的右边或μ+up的左边(单侧区间),或者在-1.和μ+p之间(双侧区间)总体的比例恰好为p。在这里,up是标准正态变量的p分位数,up的数据在表B1和表B2的末行给出。1.7通过改变原点或单位常可使计算简化。本标准是参考国际标准ISO3207《数据的统计解释一统计容许区间的确定》(1975年第--版)制订的。
国家标准局1982-12-30发布
1984-0101实施
总体的技术特性
抽样单位的技术特性
被剔除的观测值
GB3359—82
表1单侧统计容许区间(方差已知)*统计项目
样木大小:
观测值的和1:
总体方差的已知值:
标准差,
为统计容许区间选定的总体比例:p=
置信水平:
kr(n,p,l-α)=
a.“向左”的单侧区间
在下述的L,以下,总体的比例至少为P的概率是1一α。Ls=r+ki(n,p, 1-a)a=
b,“向右”的单侧区间
在下述的L,以上,总体的比例至少为p的概率是1一α。Li= -ki(n, p,1-α)=
*见本标准的例1。
(n,p,1α)
对不同的n和=0.90、0.95、0.99及1-α=0.95、0.99,h(n,,1α)的值可从表B1得出。2
总体的技术特性
抽样单位的技术特性
被剔除的观测值
统计项目
样本大小:
观测值的和:
总体方差的已知值:bzxZ.net
标准差
GB 3359—82
表2双侧统计容许区间(方差已知)*计
k,(n,p,-α))α=*
为统计容许区间选定的总体比例:p
置信水平:
ki(n,p,1-α)
总体被包含在限L,和L**之间的比例至少为P的概率是1-α。L;-i(n,p,lα)α
Li=+k(n,p,l-α)a
*见本标准的例2。
*对于不同的n和=0.90、0.95、0.99及1-a=0.95、0.99,,=(n,p,1-α)的值可从表B2得出。
**这些限对称于,但不是“按概率对称的”。因此不能说“在置信水平1-α下,不超过总体的(1一p)/2的比例在L,以下,不超过(1-p)/2的比例在L,以上”。3
总体的技术特性
抽样单位的技术特性
被剔除的观测值
GB 3359--82
表3单侧统计容许区间(方差未知)*统计项目
样本大小,
观测值的和:
(3 -)2
观测值的平方和
为统计容许区间选定的总体比例,pn
置信水平:
hz(n,p,la)
“向左”的单侧区间
(标准差α的估计)
kz(n,p1-α)S=**
在下述的L。以下,总体的比例至少为的概率是1一α。L, =+hz(n, p,1 -a) s=
“向右”的单侧区间
在下述的L,以上,总体的比例至少为的概率是1α。Li=-kz(n,p,l-α)S
*见本标准的例3 。
**对于不同的和p=0.90、0.95、0.99及1~α=0.95、0.99,k2(n,P,1~α)的值可从表B3得出。
总体的技术特性
抽样单位的技术特性
被剔除的观测值
统计项目
样本大小:
观测值的和:
观测值的平方和
GB3359—82
表4双侧统计容许区间(方差未知)*计
M(r, -x)?
为统计容许区间选定的总体比例:p=
置信水平:
k,(n,p,l-α)=
(标准差α的估计)
z(n,p,l-α)S =**
总体被包含在限L,和L***之间的比例至少为P的概率是1-α。L,=-k(n,p,1-α)S=
Ls+h(n,p,-a)S=
棉纱断裂负荷的观测值如下(单位是百分之一牛顿):228.6、232.7、238.8、317.2、315.8、275.1、222.2、236.7、224.7、251.2、210.4、270.7。这12个观测值来自同一批产品的12000个线轴。它们装在120只箱子中,每只箱子装100个。从这批产品中随机地抽取12箱,而后从每一箱中随机抽取一个线轴。试验纱是从每一个线轴上距离外端线头上大约5m处剪下的50cm长的棉纱。试验是在这些试验纱的中心部分进行的。经验表明,在这些条件下测量的断裂负荷实际上遵从正态分布。计算结果如下:
样本大小:
观测值的和:
*见本标准的例4。
i = 3024.1
**对于不同的n和p=0.90、0.95、0.99及1-α=0.95、0.99,kz(n,,1α)的值可从表B4得出。***这些限对于称至,但不是“按概率对称的”。因此,不能说“在置信水平1-α下,不超过总体(1-β)/2的比例在L;以下,不超过(1一)/2的比例在,以上”5
均值:
观测值的平方和:
与均值的差的平方和:
方差的估计:
标准差的估计:
GB 3359--82
Z?=775996.09
(i)2
由试验也可知,在同一批棉纱中,断裂负荷的分布十分接近于正态分布。例1:单侧统计容许区间(方差已知,见表1)。假定,以前获得的观测值表明,对于原料相同的不同批棉纱,虽然均值是变化的,但方差不变,其标准差=33.15。
计算L,使得能够以1~α=0.95的置信水平,断定在同样的条件下观测得的断裂负荷至少以0.95(即95%)的比例在L以上。表B1给出:
k (12,0.95,0.95)=2.12
由此得到:
L:=-kg=252.0-2.12×33.15
当然,如果取更高的总体比例(例如99%),可以获得一个更小的限L;。例2:双侧统计容许区间(方差已知,见表2)。在与例1同样的条件下,计算L;和Ls,使得能够以1~α=0.95的置信水平,断定这批棉纱的断裂负荷至少有p=0.90(90%)的比例落在Li和Ls之间。表B2给出:
k(12,0.90,0.95)=1.89
由此得到:
L; = ≤ k,g = 252.0 -1.89 × 33.15 =189.3Ls=± +kja =252.0 +1.89×33.15=314.7必须消除以下的误解:“至多有总体的5%落在L,左边,至多有5%落在L右边”。比如例1中,在Li左边不多于总体的5%,L;却为181.7。例3:单侧统计容许区间(方差未知,见表3)。假定总体的标准差是未知的,必须由样本来估计。采用与标准差已知情形(例1)相同的条件,即p=0.95和1-α=0.95。
总体的技术特性
GB 3359—82
批棉纱由12000个线轴组成。这些线轴分装在120只箱子中,每箱100个。抽样单位的技术特性
一从这批棉纱中随机地抽取12箱,而后从每箱中随机地抽取·个线轴。在每·线轴上从距离外端线头大约5米处剪下50厘米的试验纱。试验在这些试验纱的中心部分进行的。被别除的观测值:没有
统计项目
样本大小:
观测值的和:
Zxi=3 024.1
观测值的平方和:
Zr = 775 996.09
为统计容许区间选定的总体比例p = 0.95 (95%)
置信水平:
1 → α = 0.95
,k2(12,0.95,0.95)=2.74(从表B3得出)结果
(x; -)2
775 996.09
α()2/n
(3 024,1) 2 / 12
=S =V/1 263.4 = 35.5
kz(12,0.95,0.95)S=97.3
以置信水平0.95断定,这批棉纱的断裂负荷至少有0.95(95%)的比例在L以上L;=252.02.74 × 35.5 = 154.7
必须注意,L;的值小于例1(方差已知)中L:的值,原因是用S估计α,使得系数的值较高(以2.74代替2.12)
例4:双侧统计容许区间(方差未知,见表4)在与例3相同的条件下,要计算L;和Ls,使得能够以置信水平1-α=0.95,断定这批棉纱的断裂负荷至少有p=0.90(90%)的比例落在L:和Ls之间。表B4给出:
由此得到:
k,(12,0.90,0.95)=2.66
L; = ≤ -k,S = 252.0-2.66×35.5= 157.6
Ls = ± +h,S = 252.0 +2.66×35.5=346.4应该注意,L;的值比例2的小,Ls的值比例2的大,原因是用S估计r,系数的值较高(以2.66代替1.89)。
由于不知道总体的标准差α,不得不付出代价,扩大区间的原因就在于此。当然,如果不完全相信在例1和例2中所用的值α=33.15是正确的,那么在例3和例4中用S估计可能是恰当的。GB3359--82
附录A
任意分布的情形
(补充件)
本附录规定使用样本极值(最小值和最大值)m和工M的方法。A.1引言
当样本大小为n的简单随机样本遵从连续分布时,无需其他假定,就能够从样本最小值㎡和最大值“M或仅从其中的一个得到分布的散布程度的信息。除样本极值外,还可以使用其他的次序统计量,但在本附录A中不给出。A.1.1单侧情形
在样本大小n、置信水平1-α和总体在m以上(或在m以下)的比例p之间有如下关系:p\=a
如果取定n和p,由这个关系式可计算出1-α。总体落在r以上(或αm以下)的比例至少为p的概率不小于1—α。
如果取定n和1-α,由这个关系式可计算出P。总体落在αm以上(或工m以下)的比例至少为p的概率不小于1-α。
如果取定p和1-α,由这个关系式能确定最小样本大小n。由此能以不低于1~α的置信水平,断定总体落在样本大小n的样本最小值以上(或最大值以下)的比例至少为P。A.1.2双侧情形
在样本大小n、落在m与M之间的总体比例p和置信水平1α之间有如下的关系:npa-1_(n-1)p\=α
如果取定n和p,由这个关系式可计算出1一α。总体落在~m和M之间的比例至少为P的概率不小于 α。
如果取定n和1一α,由这个关系式可计算出p。总体落在m以上(或m以下)的比例至少为p的概率不小于1a。
如果取定p和1~α,由这个关系式可确定最小样本大小n,使得能以不低于1一α的置信水平,断定总体落在样本大小n的样本最小值与最大值之间的比例至少为P。A.2举例
对一部航空发动机的部件进行旋转应力的疲劳试验。样本大小为15。将耐久力的观测值按从小到大的次序排列成下表:
GB335982
图检验祛表明,部件总体的正态性假设被拒绝。因此,例3和例4确定统计容许区间的方法不适样本极值:
m=0.200,xm=8.800
置信水平:
1 -α= 0.95
A.2.1部件总体落在m=0.200以下的最大比例是多少?对于1-α=0.95,表B5给出总体落在m以上的最小比例p的值稍高于0.75(75%)。因此,总体落在m以下的最大比例1一P的值稍低于0.25(25%)。由诺模图1可见P约为0.82。A.2.2必须取多大的样本大小才能以置信水平0.95,断定部件总体至少以P=0.90(90%)的比例落在该样本的最大值之下?
对于1-α=0.95和p=0.90,表B5给出n=29。A.2.2.1在置信水平0.95下,部件总体落在m=0.200和M=8.800之间的最小比例是多少?对于1α=0.95和n=15,表B6给出的P值稍低于0.75(75%)。由诺模图2可见p约为0.72。
A.2.2.2必须取多大的样本大小才能以置信水平0.95,断定部件总体至少以p=0.90(90%)的比例落在该样本的最小值和最大值之间?对于1-α=0.95和p=0.90,表B6给出n=46。9
GB3359-82
附录B
统计:
(补充件)
单侧统计容许区间,α已知,μ未知s+kra或-g
系数(,p,-α)的值
1 -a= 0.95
1 - α = 0, 99
GB3359-82
表B2双侧统计容许区间,α已知,μ未知!±kig
系数(n,p,1-α)的值
1-α=0.95
1 -α=0.99
GB3359--82
表B3单侧统计容许区间,μ,α未知+k,S或至-kzS,
系数2(n,p,l-α)的值
1-α=0.95
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。