首页 > 国家标准(GB) > GB/T 4088-2008 数据的统计处理和解释 二项分布参数的估计与检验
GB/T 4088-2008

基本信息

标准号: GB/T 4088-2008

中文名称:数据的统计处理和解释 二项分布参数的估计与检验

标准类别:国家标准(GB)

英文名称:Statistical interpretation of data Estimation and hypothesis test of parameter in binomial distribution

标准状态:现行

发布日期:2008-07-16

实施日期:2009-01-01

出版语种:简体中文

下载格式:.rar.pdf

下载大小:1642020

标准分类号

标准ICS号:社会学、 服务、公司(企业)的组织和管理、行政、运输>>质量>>03.120.30统计方法的应用

中标分类号:综合>>基础学科>>A41数学

关联标准

替代情况:替代GB/T 4087.1-1983;GB/T 4087.2-1983;GB/T 4088-1983

出版信息

出版社:中国标准出版社

页数:52页

标准价格:34.0 元

计划单号:20060801-T-469

出版日期:2009-01-01

相关单位信息

首发日期:1983-12-21

起草人:于振凡、孙山泽、吴玉銮、邓穗兴、丁文兴、黄艳、蔡玮红、侯向昶、房祥忠

起草单位:中国标准化研究院

归口单位:全国统计方法应用标准化技术委员会

提出单位:全国统计方法应用标准化技术委员会(SAC/TC 21)

发布部门:国家标准化管理委员会

主管部门:国家标准化管理委员会

标准简介

本标准规定了二项分布参数的估计与检验方法。 本标准是在GB/T 4087.1—1983 《数据的统计处理和解释 二项分布参数的点估计》、GB/T4087.2—1983 《数据的统计处理和解释 二项分布参数的区间估计》和GB/T4088—1983 《数据的统计处理和解释 二项分布参数的检验》的基础上整合而成。 本标准代替GB/T4087.1—1983 、GB/T4087.2—1983和GB/T4088—1983。本标准与GB/T4087.1—1983、GB/T4087.2—1983、GB/T4088—1983相比较,技术内容的变化主要包括:———按GB/T1.1—2000《标准化工作导则 第1部分:标准的结构和编写规则》的要求对标准格式进行了修改;———增加了p值检验。 GB/T 4088-2008 数据的统计处理和解释 二项分布参数的估计与检验 GB/T4088-2008 标准下载解压密码:www.bzxz.net
本标准规定了二项分布参数的估计与检验方法。
本标准是在GB/T 4087.1-1983 《数据的统计处理和解释 二项分布参数的点估计》、GB/T4087.2-1983 《数据的统计处理和解释 二项分布参数的区间估计》和GB/T4088-1983 《数据的统计处理和解释 二项分布参数的检验》的基础上整合而成。
本标准代替GB/T4087.1-1983 、GB/T4087.2-1983和GB/T4088-1983。
本标准与GB/T4087.1-1983、GB/T4087.2-1983、GB/T4088-1983相比较,技术内容的变化主要包括:
---按GB/T1.1-2000《标准化工作导则 第1部分:标准的结构和编写规则》的要求对标准格式进行了修改;
---增加了狆值检验。
本标准的附录A、附录B、附录C、附录D、附录E、附录F、附录G 与附录H 均为规范性附录。
本标准由全国统计方法应用标准化技术委员会(SAC/TC21)提出并归口。
本标准起草单位:中国标准化研究院、北京大学、广州市产品质量监督检验所、海南省产品质量监督检验所。
本标准主要起草人:于振凡、孙山泽、吴玉銮、邓穗兴、丁文兴、黄艳、蔡玮红、侯向昶、房祥忠。
本标准所代替标准的历次版本发布情况为:
---GB/T4087.1-1983;
---GB/T4087.2-1983;
---GB/T4088-1983。
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T4086.2 统计分布数值表 χ2分布
GB/T4086.4 统计分布数值表 犉分布
ISO3534-1:2006 统计学词汇及符号 第1部分:一般统计术语与用于概率的术语
ISO3534-2:2006 统计学词汇及符号 第2部分:应用统计

前言Ⅲ
引言Ⅳ
1 范围1
2 规范性引用文件1
3 术语、定义和符号1
4 二项分布参数的点估计2
4.1 经典估计法2
4.1.1 样本的抽取方式2
4.1.2 估计量2
4.1.3 例子2
4.2 序贯样本估计法2
4.2.1 样本的抽取方式2
4.2.2 估计量2
4.2.3 例子2
5 二项分布参数的区间估计3
5.1 比率狆的双侧置信区间和单侧置信区间3
5.2 置信区间的求法3
6 二项分布参数的检验7
6.1 原假设与备择假设7
6.2 双侧检验 犎0:狆=狆0,犎1:狆≠狆0 7
6.2.1 实施步骤7
6.2.2 拒绝域的临界值犮1、犮2的确定7
6.2.3 示例8
6.3 上限单侧检验10
6.3.1 实施步骤10
6.3.2 拒绝域临界值犮2的确定10
6.4 下限单侧检验10
6.4.1 实施步骤10
6.4.2 拒绝域临界值犮1的确定11
附录A(规范性附录) 根据对点估计的绝对误差限确定狀及犮的方法12
附录B(规范性附录) 其他几种估计方法13
附录C(规范性附录) 置信上限表(狀=10(1)30) 14
附录D(规范性附录) 图解法28
附录E(规范性附录) 拒绝域上侧临界值表32
附录F(规范性附录) 显著性检验中的两类错误37
附录G(规范性附录) 检验犎0 的等效方法42
附录H(规范性附录) 给定第一、第二类错误时样本量狀的估算43

标准图片预览






标准内容

ICS 03.120.30
中华人民共和国国家标准
GB/T 4088--2008
代替 GB/T 4087.1---1983,GB/T 4087.2—1983,GB/T 4088—1983数据的统计处理和解释
二项分布参数的估计与检验
Statistical interpretation of data-Estimation and hypothesis test of parameter in binomial distribution2008-07-16 发布
中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会
2009-01-01实施
1范围
2规范性引用文件
3术语、定义和符号.
4一项分布参数的点估计
4.1经典估计法
4.1.1样本的抽取方式
4,1.2估计量
4.2序贯样本估计法
4.2.1样本的抽取方式
4.2,2计量
4.2.3例子
5二项分布参数的区间估计
5.1比率P的双侧置信区间和单侧置信区间5.2置信区间的求法
二项分布参数的检验
6.1原假设与备择假设
6.2双侧检验Ho:p=po,H1:p≠po
6.2.1实施步骤.…
6.2.2拒绝域的临界值c1、C2的确定6.2.3示例
6.3限单侧检验
实施步骤
拒绝域临界值 c2的确定
6.4下限单侧检验-
6.4.1实施步骤
6. 4. 2拒绝域临界值 c1的确定附录A(规范性附录)
附录 B(规范性附录)
附录C(规范性附录)
附录 D(规范性附录)
附录E(规范性附录)
附录F规范性附录)
附录G(规范性附录)
附录 H(规范性附录)
根据对点估计的绝对误差限确定n及。的方法其他几种估计方法
........
置信上限表(n=10(1)30)
图解法
拒绝域上侧临界值表
显著性检验中的两类错误
检验 Hu 的等效方法
给定第一、第二类错误时样本量n的估算GB/T 4088—2008
CB/T 4088--2008
本标准是在GB/T4087.11983数据的统计处理和解释二项分布参数的点估计》,
CB/T4087.2:·1983《数据的统计处理和解释二项分布参数的区估计》和GB/T40881983《数据的统计处理和解一项分布参数的检验》的基础目整合而成,本标准代替GB/T4087.1---1983.GB/T4087.21983和GB/T4088—1983。本标准与GB/T4087.1—1983,GB/T4087.21983.GB/T4088—1983相比较,技术内容的变化主要包括:
按GB/T1.1:2000《标准化工作导则第1部分:标准的结构和编写规则》的要求对标准格式进行了修改;
增加了力值检验。
本标准的附录A、附录B、附录C、附录D.附录E、附录F、附录G与附录H均为规范性附录。本标准由全国统计方法应用标准化技术委员会(SAC/TC21)提出并归口。本标准起草单位:中国标准化研究院、北京人学、广州市产品质最监督检验所、海南省产品质量监督检验所。
本标准主要起草人:丁振凡、孙山泽、吴玉崧、邓穗兴、丁文兴、黄艳、蔡玮红、侯向昶、房祥忠。本标准所代替标准的历次版本发布情说为:-GB/T 4087.1—1983;
CB/T4087.2—1983,
GB/T10881983。
GB/T 4088-2008
从事科学研究、工农业制造以及管理工作都离不开数据,而对这些数据的整理、分析和解释都离不开统计方法。统计学是研究数字资料的整理,分析和正确解释的一门学科。人们各自从不的来源取得各种数字资料,这些数字资料通带都是杂乱无章的,必须经过整理和简缩才能利用,使用完善的统计方法就可使数据整理、排列的有条有理,用图形或少的几个重要参数,就可把一大堆数据的特征表达出来,这样既可避免不正确的解释,义可将获得满意数据的成本降到最低限度,提高了经济效益。&数据的统计处理和解释》含有多项国家标准,它们是:统计容恐区间的确定(GB/T3359)均值的估计和置信区间(GB/T3360)在成对观测值情形下两个均值的比较(GB/I3361)一项分布参数的估计与检验(GB/T4088)泊松分布参数的估计与检验(GB/T4089)正态性检验(GB/T4882)
让态样本离群值的判断和处理(GB/T4883)-正态分布均值和方差的估计与检验方法(GB/T4889)正态分布均值和方差检验的功效(GB/T4890)I型极值分布样本离群值的判断和处理(GB/T6380)伽玛分布(皮尔逊Ⅱ型分布)的参数估计(GB/T 8055)指数分布样本离群值的判断和处理(GB/T8056)1范围
数据的统计处理和解释
二项分布参数的估计与检验
本标准规定了二项分布参数的估计与检验方法。GB/T 4088-—2008
设总体中的部分个体具有某种特性,力是总体具有此种特性的个体的比率。例如力可以是一批产品中不合格品的比率。从总体巾随机地、独立地抽取若子个个体作为样本。本标准规定了基于这类样本,对总体的参数力作点估计、区问估计及检验的方法。对有限总体,设其大小为N(N应充分大),样本量为n。当抽取是有放回时,或当抽取是无改回的,但量<0.1时,n次抽取可以认为是独立的。2规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的号用文件,其最新版本适用于本标准。GB/T4086.2统计分布数值表分布GB/T4086.4统计分布数值表F分布ISO3534-1:2006统计学词汇及符号第1部分:-般统计术语与用于概率的术语JSO3534-2:2006统计学词汇及符号第2部分:应用统计3术语、定义和符号
ISO3534-1:2006、ISO3534-2:2006和GB/T19000—2000确定的术语和定义以及下列术语,定义和符号适用于本标准。为便于参考,某些术语和符号直接引自上述标准。n样本量
力总体中具有指定特性的个休的比率力的区间估计的置信下限
pu的区间估计的置信上限
1一a区问计的置信水平
样本中具有指定特性的个体的个数显著性检验的第类错误概率
β显著性检验的第二类错误概率当原假设为真时,拒绝原假设的概率β当原假设错误时,没有拒绝原假设的概率Hc显著性检验的原假设
H1显著性检验的备择假设
P(AI事件A的概率
N有限总体所含的个体数最
GB/T4088—2008
4二项分布参数的点估计
4.1经典估计法
4、1.1样本的抽取方式
样本量元是事先规定的。样本从总体中随机地、独立地抽取。此时样本中具有某种特性的个体的个数工是服从二项分布的随机变量X的一次观测值。X取值:的概率为P(X=ln,p)=(p(1 p)-+,r=0,l,2,,4. 1.2估计量
力的估计记为
式中:
样本量。其确定方法可参见附录A公式(A,1);一一样本中具有指定特性的个体的个数。4.1.3例子
为估计一批产品(约1000件)的不合格品率,从中随机地抽取40件为样本,其中有5件不合格品。测
0=年5
4.2序贯样本估计法
4.2. 1 样本的抽取方式
事先不规定样本凿,而是以总体中顺序地、随机地,独文地抽取个体。舞抽取一个个体,立即检查该个体是否其有指定的特性,不断累计具有指定特性的个体的个数,当具有指定特性的个体数达到事先规定的数c(大于或等于2的整数)时,停止抽样。此时,累计抽取的个体的总个数n是一个服从负二项分布的随机变量,n最值的概率为:p(n-rlc,p)-(=1)pr(1-p),*,k=c,c+1,**4. 2. 2 估计量
式中:
事先规定的具有指定特性的个体达到的个数。其确定方法可参见附录A公式(A,2);达到个具有指定特性的个体时,累计取的个体总数。4.2.3例子
为估计一批产品(约1000件)的不合格品率,顺序地逐个抽样检验,规定发现5件不合格品时停正抽样:当抽到第35件时,发现了第5件不合格品,则c—5
=C—1
—1 34
5二项分布参数的区间估计
5.1比率P的双侧置信区间和单侧置信区间GB/T 4088—2008
的双侧置信区间是(.u),这里≤r<,称为置信下限,称为置信上限力的单侧置信区间有如下两种形式:a)仅有置信下限(O≤<)的置信区间(,1。b)仅有置信上限加(0<≤1)的置信区间[0.)。这些区间必然包含力的点估计更一选用哪种类型的区间,要根据具体问题的性质而定,不依赖于观测值无和是观测值的两个函数,本标准采用的置信区间所满足的条件为:所求得的置信区间包含真正的值这个事件发生的频率约等于置信水平1一α。具体地说,双侧区间应满足Pi=a
单侧区间应满足
P(p或 P1
概率1一α称为置信水平。根据不同的要求,1一a的数值通常从0.90,0.95,0.99中选取。由于二项分布的离散性,不一定都能求得使上述等式成立的L,u,这时可瑕pL,满足Piplpu1
或P(p)
或ipuizl
(双侧情形)
(单侧下限)
(单侧上限)
这不置信区间包含真值的实际概辜称这个区间的“置信水平的实际值”5.2置信区间的求法
5.2.1当n10时,置信区间。般太宽,实际上使用的很少。5.2.2当n10,公式(3)、(4)近似给出了置信水乎为 [一α的单侧置信限。单侧置信下限
v +FI (,U2)
式中:=2(—+1),±2。
单侧置信上限
式中: =2(n—x),2=2(+1).
(3)
此处的Fi-。()是白由度为i,v)的F分布的1-α分位数,它的值可由F分布表(见GB/T 4086.4)中查得。
5.2.3当n≥10,下面的公式近似给出『置信水平为1一的双侧置信限。置信下限
式中:=2(n—+1),2—2:
置信上限
式中:=2(nz),=2(r -1)。www.bzxz.net
V2 +Fi-a/2(,)
Vz +b1F1-a/2(V2,±1)
(6)
GB/T408B—2008
此处的Fi-(,)是自由度为(u,)的F分布的「一α分位数,它的值可用F分布表(见GB/T4086.4)中套得。
为了方便使用,本标推给出了当10≤n≤30时,相应于不同置信水平的置信限的数值表(见附录C中表C. 1)。
单侧置信区问或双侧置信区间的置信上限的值可从表C.!中直接读出。对于单侧置信区间或双侧置信区间的置信下限证,只需用一n一工代替,从表C.1巾读出相应于的值,记为h,1一h就是相应于的值。例某试验中:若n=20,=8,取1—α-0.95a)求单侧置信区间[o,u)。
n=20,2=8;
从表 C. 1 中读出与 n、z 相应的 pu=0. 606,单侧置信区间为[0,0.606)。
b)求单侧置信区间(pl1]。
n-20,z-8,-n—z-20-8-12
从附录C中表C,1(n=20)中得到n、相应的h=0.783,pr. -1-h- 1 -- 0. 783—0. 217,单侧置信区间为(0,217,1二。
c)求双侧置信区间(pL.pu)。
n=20,2=8,2=n—2=12;
从附录 C的表 C. 1(n二20)中得到 n、1: 相应的二0, 639,pu=h=0.637;
从附录 C的表 C. 1(n-20)中得到 n、元相应的h=0. 809,pr=1—h=1—0. 809=0. 191;
双侧置信区间为(0.191,0.639)。5.2.4当>30,且0. 1<三
<0.9时,臀信水乎为1一α的置信限由下面的近似公式(7),(8)给出:pl -p+ -u/p.(i=p.)/(n+2d)
pu -p* +u/p*(l-p*)/(n+2d)
式中:
p,=z+d-0.5
p*=z+d+o. 5
n→-2d
比,d为常数。对不同的置信水半,u,d的取值见表1,表1
置信水平
例:某试验中:n=10,r=12,取1—@=0.95,4
·(8)
a)求单侧置信区间[0,pu),
1---α-0. 95 查表1得 u=1. 645,d-1,n40,x-12
+*=±+0.5_121+0:5=0.321
40+2×1
/p*(1-p*)/(n+2d)-0.072
GB/T 4088—2008
pu=p*+uvp(1-p)/n+2d)-0.321+1.645×0.072=0.439单侧置信区间是[0,0.439】。
b)求单侧置信区间(PL,1。
1a=0. 95,查表 1得u-1. 645,d=1,n=40,x12
p, -+d-o. 5
512-1-0.5
40+2×1
p(1=p.$/(n+2d)=0.071
P.=p,—uVp,(1-p,57(n+2d)-0.298-1.645×0.071=0.181单侧置信区间是(0.181,1。
c)求双侧置信区阅(r.,)。
1—=0. 95,查表 1得 u=1. 960,- 1. 5n=40,r=12
p#+4-05±12+15-0. 5
40+2×1.5
p*=#+d+0.5_12+1.5+0.5
10+2×1.5
/p.(1-p.)/(n+2d)-0.070
P,=p,—up(1—p.)/(n-2d)=0.302—1.960×0.070=0,165Vp*(1-p)/(n+2a)0.071
Prp\+wVp*(1 p*)/(n- 2d)
=0. 326 -1 1. 960× 0, 071
双侧置信区间是(0.165,0.466)。5当n>30,且~≤0.1或至≥0.9时,可来用泊松近似。这种近似需婴利用x分布表(见5.2. 5
GB/T4086.2)。这时置信下限为
2n--1+
n+a-a'
In+x-x
对于单侧置信区间,式中
(2x)
当三接近于0
当至接近于1
x-.[.2(n)+2]
GB/T4088—2008
对于双侧置信区间,式中
置信上限为
对于单侧置信区间,式中
对于双侧置信区间,式中
/2(2z)
xi-a/2[2(n—)+2]
2n—x+
++1—
当天接近于0
当接近于1
xi-。(2+2)
x[2(n2)
-/2(2+2)
x2[2(n)
这里,)表示自由度为的分布的分位数。例,某试验中;n=50,r=5,取1…α=0.95,a)求单侧置信区间[0,)。
n—50,x—5,
一0.1,用接近于零的公式。
.9(12)
x。(2+2)=号
×21.026--10.513
2×10.513
5~2×50-5+10.513
2n—r+>
单侧置信区间是[0.0.199)。
b)求单侧置信区间(,1]
n=50,2=5,
一0.1,用接近于零的公式,
xi-。(22)
.5(10)
×3.9401.970
2×1. 970
pL=2n-2+1f+\2x50-$+141. 970=0. 040单侧置信区间是(0.040,13
c)求双侧置信区间(pl,pu)。2=50,元—5,=0.1,用接近于零的公式。对.有
x2(22)
xo.D23(10)
对,有
X3.247=1.621
pl.2n*41+±-2x50-$+141,624-0. 0330.975(12)
-/2(22)~
X23. 337=11, 669
2×11.669
PU2n:4±-2×505+11.669
双侧置信区间是(0.033,0.219)。6二项分布参数的检验
6.1原假设与备择假设
GB/T 4088---2008
用Ho表示原假设,Hi表示备择假设。o是给定值,0≤a≤1。本标推处理常见的三种情况:Hc:=po,H(双侧检验)
Ha:oH:>p(单侧检验)
Hc:pe.Hi:<(单侧检验)
选用哪种类型的检验,要根据具体问题的需要而定。6. 2双侧检验 Ha:p=o,H1:ppo
6.2. 1实施步骤
a)由 po、样本量 n及给定的检验的显著性水平-u,确定拒绝域的临界值 1、t2(c1、2的确定见6.2.2).
b)累计抽收的n个个体中具有该种特性的个体的个数工。)当 ≤c或c时,拒绝 H
当 16.2.2拒绝域的临界值c1、c2的确定拒绝域是这样一些值的集合,如果观测值是这些值中的一个,则拒绝源假设H。拒绝域的临界值c1、C2由如、n及检验的显著性水平a确定。C是满足下式的最大整数
(X≤cno)=
2是满足下式的最小整数
()(1-o)≤号
()(1-o)≤号
P(X2c n,)=
相应的两类错误的概率的计算见附录F。附录E中的表E.2、E.3、E.5分别给出了α=0.10,0.05,0.01时,双侧检验的拒绝域的上侧临界值。根据给定的显著性水平α,选择相应的表,2的值可按n放Po从表中直接读出。在求拒绝域的下侧临界值c1时,可以用y=1一加替代加,按n及go从表中查出cn一c即为所求的c1值。对附录上中末列出的α、n、,可以用表2给出的方法确定临界值1和 r2。7
GB/T 4088--2008
原假设和拒绝域的形式
查表法
用F分布表法
简单正态近似法
平方根正态近似
Ho:=pe
I是满足下式的最大整数
P(Xe n pc)≤号
是使下列式子成立的最大整数
Fi-(n,n)po
其—2(c +1),Y2—2(n-:)
cnpp--0..—ui a/z/nprgp....... (13)或
c2 是满足下式的最小整数
P(xzcalnpe)≤号
c2 是使下列式了成文的最小整数i2)
其中 1=2(—c +1),%2 --2c2
22≥n+0.5+l-/2/npgu...(14)
2wg-+1)p-a/2
2/(n--)c+1)q)≥2*(15)
(16)
表中 9 --1一,1.-/2为标准正态分布的1—α/2分位数,F1-a/(71,2)为白由度为(1,2)的 F分布的1一α/2分位数。
注:①篇单正态近似的误差较大:一般不宜采用。②使用F分布表或平方根正态近似确定c1c2时,可以先利H简单正态近似确定一个 c:、2的预估值,然后再用相应的公式找,c2+这样比较便。6.2.3示例
考您-50,--0.10,原假设H:P==0.10.求拒绝域的临界值c.c2。下面按照6.2.2中给出的各种方法计算c1-c2:6.2.3. 1查表法
本例n=50,=0.10,a/2--0.05,=0.10,求双侧检验拒绝域临界值。查相应的表F.2,由n-50,-0.10得cz=10;再出g=1—=0.90,4-50查得—45,得c1=n—c=50—49=1。6.2.3.2简单正态近似法
本例n- 50,0.10+4o=0. 90,21-a/2= 2D,95=1. 645,npc -0.5 - uc.9wnpo4c--1.01,c1是不人于1.01的最大整数,
所以 c: =1.
po +0. 5+ur.95npg—8. 99,
(2是不小于8.99的最小整数,
所以 cz 9(比准确值 10 小)。
6.2.3.3用F分布表法
是满足下式的最大整数
F-a/2(,Y2)≤2pu
—2(c+1),=2(n-C1)
本例n=50,=0.10.90.90,以上面简单正态近似的c:=1,c2=9为预估值。7. =2(c1 1 1)=4
Y2 =2(n --1)=98
查F分布表(见GB/T4086.4)得0.95分位数如下:Fo.9(4,90)=2. 47
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。