标准简介
本标准涉及的总体为正态分布。本标准适用于对总体均值和方差进行估计或检验。 本标准修改采用国际标准ISO2854:1976。本标准与ISO2854:1976 相比较,技术内容的变化主要包括:———将ISO 中分在两章的方法和示例改为按条叙述,便于理解;———在表犆等许多表的说明中,略去原先大量与前述表相同的重复说明;———将涉及的正态性检验部分内容略去;———将成对数据比较的内容略去;———将结构进行重新安排,每一个方法后面都跟一个说明性示例;———增加了规范性附录B:使用p值进行假设检验。本标准代替GB/T4889—1985。本标准与GB/T4889—1985相比较,技术内容的变化主要包括:———按GB/T1.1—2000《标准化工作导则 第1部分:标准的结构和编写规则》的要求对标准格式进行了修订;———增加了术语、符号和定义;———将样本大小改为样本量;———将结构进行重新安排,每一个方法后面都跟一个说明性示例;———增加了规范性附录B:使用p值进行假设检验。 GB/T 4889-2008 数据的统计处理和解释 正态分布均值和方差的估计与检验 GB/T4889-2008 标准下载解压密码:www.bzxz.net
本标准涉及的总体为正态分布。
本标准适用于对总体均值和方差进行估计或检验。
本标准修改采用国际标准ISO2854:1976。本标准与ISO2854:1976 相比较,技术内容的变化主要包括:
---将ISO 中分在两章的方法和示例改为按条叙述,便于理解;
---在表犆等许多表的说明中,略去原先大量与前述表相同的重复说明;
---将涉及的正态性检验部分内容略去;
---将成对数据比较的内容略去;
---将结构进行重新安排,每一个方法后面都跟一个说明性示例;
---增加了规范性附录B:使用狆值进行假设检验。
本标准代替GB/T4889-1985。本标准与GB/T4889-1985相比较,技术内容的变化主要包括:
---按GB/T1.1-2000《标准化工作导则 第1部分:标准的结构和编写规则》的要求对标准格式进行了修订;
---增加了术语、符号和定义;
---将样本大小改为样本量;
---将结构进行重新安排,每一个方法后面都跟一个说明性示例;
---增加了规范性附录B:使用狆值进行假设检验。
本标准的附录A 和附录B均为规范性附录。
本标准由全国统计方法应用标准化技术委员会提出并归口。
本标准起草单位:华东师范大学、中国标准化研究院、北京大学、铁道部。
本标准主要起草人:濮晓龙、李艳、丁文兴、于振凡、孙山泽、邱宏静、杜春平、陈玉忠。
本标准所替代标准的历次版本发布情况为:GB/T4889-1985。
下列文件中的条款通过本标准的引用成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适于本标准。然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T4882-2002 数据的统计处理和解释 正态性检验
ISO3534-1:2006 统计学词汇及符号 第1部分:一般统计术语与用于概率的术语
ISO3534-2:2006 统计学词汇及符号 第2部分:应用统计
前言Ⅲ
1 范围1
2 规范性引用文件1
3 术语、定义和符号1
3.1 术语和定义1
3.2 符号2
4 总则2
5 单正态总体均值的检验与估计2
5.1 单总体均值的检验2
5.2 单正态总体均值的区间估计5
6 两正态总体均值的比较7
6.1 两总体均值比较的检验7
6.2 两总体均值差值的区间估计10
7 单正态总体方差或标准差的检验与估计12
7.1 单总体方差或标准差的检验12
7.2 单总体方差或标准差的区间估计13
8 两总体方差或标准差的比较14
8.1 两总体方差或标准差比较的检验14
8.2 两总体方差或标准差比值的区间估计16
附录A (规范性附录) 统计数值表18
附录B (规范性附录) 使用狆值进行假设检验27
标准内容
ICS 03. 120. 30
中华人民共和国国家标准
GB/T 4889—2008
代替GB/T4889—1985
数据的统计处理和解释
正态分布均值和方差的估计与检验Statistical interpretation of data-Techniques ofestimation and tests relating to means and variances ofnormal distribution
(ISO2854.1976,MOD)
2008-07-28发布
中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会
2009-01-01实施
2规范性引用文件
3术语、定义和符号
3.1术语和定义
3.2符号
A总则
5单正态总体均值的检验与估计
5.1单总体均值的检验
5. 2单正态总体均值的区间估计6两正态总体均值的比较
6.1两总体均值比较的检验
6. 2两总体均值差值的区间估计?单止态总体方差或标准差的检验与估计7.1单总体方差或标推差的检验·7.2单总体方差或标准差的区间估计.8两总体方差或标准差的比较·
8.1两总体方差或标准差比较的检验目
8.2两总体方差或标准差比值的区间估计附录A(规范性附录)统计数值表附录B(规范性附录)使用力值进行假设检验次
GB/T 4889—2008
GB/T 4889—2008
本标准修改采用国际标准1502851:1976。本标准与1S02851:1976相比较,技术内容的变化主要包括:
---将ISO中分在两章的方法和示例改为按条叙述,便于理解:在表C等许多表的说明中,略么原先大量与前述表相同的重复说明;将涉及的正态性检验部分内容略去:-将成对数据比较的内容略去;
将结构进行重新安排,每一个方法后面都跟一个说明性示例;-增加了规范性附录 B:使用 β值进行假设检验。本标准代替GB/T48891985。本标推与GB/T4889—1985相比较技术内容的变化主要包括:按GB/T1.12000标准化T作导则第1部分:标准的结构和编写规则》的要求对标推格式进行了修订:
增加了术语、符号和定义;
将样本大小改为样本量;
一将结构进行重新安排,每一个方法后面都跟·个说明性示例;增加了规范性附录B使用力值进行假设检验,本标准的附录A和附录B均为规范性附录本标准由全国统计方法应用标准化技术委员会提出并归口。本标准起草单位:华东师范大学、中国标化研究院、北京大学、铁道部。本标主要起草人:濮晓龙、李艳、文兴、于振凡、孙泽,邱宏静、杆春平、陈玉忠。本标准所替代标准的历次版本发布情况为:GB/T4889—1985,1范围
数据的统计处理和解释
正态分布均值和方差的估计与检验,本标准涉及的总体为正态分布,本标摊适用于对总体均值和方差进行估计或检验,2 规范性引用文件
GB/T 4889--2008
下列文件中的条款通过本标推的引用成为本标摊的条款。凡尼注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版内不适于本标准。然而,鼓励根据本标准达成协议的各方研究展否可使用这些文件的最新版本。凡是不注口期的引用文件,其最新版本适用于本标准,G13/T4882—2002数据的统计处理和解释正态性检验IS03534-1=2006统计学词汇及符号等1部分:一般统计术语与用于概率的术语IS03534-2:2006统计学词汇及符号第2部分:应用统计3术语、定义和符号
ISO3534-1:2006和ISO3534-2,2006确定的术谱和定义以及下列术语、定义和符号适用于本标准。为便于参考,某些术语直接引白上述标准。3.1术语和定义
显著性水平significancc Ievel在假设检验中,原假设为真而拒绝原假设(犯第一类错误)的概率的最大值。注1:对双侧检验情形,显著性水平。就是原假设为真而拒绝原假设的概率,对单测检验情形,显奢性水平。就是这一概卒的最大值。
注2:的取值应根据使用者准备承受的风险选取,实际中,常被取作0.05或0.01。由于一个假设有可能在α二0.05时被拒绝而在α=0.C1时未被拒绝,此时采用以下说法是合适的:\原假设在显著性水平α二0.05下被拒绝”,或“原假设在显著性水平α=0.01下未被拒绝\。往3:特别要注意还存在第二类错误,当原假设错误但未拒绝原假设就犯了这一错误。关于统计检验的术谱见ISO 3534-1:20cG.
置信水平confidence level
被估参数的置信区间包含参数真值的概率。注1:置信水平通常取0.95、D.99,即a=0.05或-0.01。3. 1.3
P分位数pquantile
使得分布函数F()的值不小于(0<1)的的最小值。1
GB/T 4889—2008
3.2符号
1+22+***+2,
=(2 -)
s=(2-2)
4总则
样本量
总体均值
总体方差
总体标差
样本壁为几的简单随机样本
样本均值(
也可记为,下同)
样本方差
样本标推差
<假设检验≥显荠性水
二区间估计≥置信水平
标准正态分布的口分位数
自由度为的分布的分位数
自由度为的\分布的分位数
自由度为和的F分布的分位数
4.1本标准假定样本是随机抽取并且独立的。对无限总体,独立性通常满足;对有限总体,当总体足够大或抽样比足够小(例如小于1/10)肘,独立性也可认为满足。4.2本标准假定规测值的分布为正态分布。若实际分布与正态分布偏差不大且梓本愈不太小,使用本标难中规定的方法是近似合理的,其近似程虚对大部分实际情况是足够的。此时要求表A、B、C、D中样本量不小于5,在其他表(A'、B、C'、D'、E、F、G、H)中样本量不能小于20。4.3关于正态性假设的检验方法详见GB/T4882—2002。实际中,通常是根据其他-些信息来假定总体的正态性,而不是根据样本本身。当正态性假设被拒绝时,可采用非参数方法对均值和方差避行估计或检验,或通过适当的变换(例如log(a十a).1/z、Vr+a)转换为近似正态分布,再采用本标准中的方法。在使用变换时,变换的选择及结果的解释要谨慎。4.4如果只是需要估计变量X的均值或方差,无论总体是否服从正态分布,样本均值元利样本方差s分别是总体均值和总体方差的无偏估计。4.5对于每一个统计分析,都应该给出有关数据来源和数据收集力法的详细信息,这些信息有助于统计分析结果的解释,特别是计量单位或计量的最小单位都应该具有实际意义。4.6若未找到试验、技术等方面的原因,即使观测数据值得怀疑,也不能剔除或者更改。任何被剧除或更改的观测数据及其理由都应予以说明。5单正态总体均值的检验与估计
5.1单总体均值的检验
5.1.1方差已知的单总体均值的检验2
总体的技术特征(见4.5)
样本的技术特征(见1,5)
除或更正的观谢值(见4.6)
统计数据
样本量:
观测谊和:
设定值:
已知总体方差:
或标推差:一
显著性水平:α=
双侧检验:
表A总体均值和设定值的比较(方差已知)计算
[u-+Nna-
[u--n n o-
当|—「1/时,拒绝总体均值与设定值相等的假设(原假设)。单例检验:
a)当--<—[u-/时,拒绝总体均值不小于 的假设(原假设);b)当一>「u-/n时,拒绝总体均值不于μ的假设(原假设)。注1:由标准正态分布α分位数。的定义,有u=一-。,见下图:()
:—/3
P/2/21
双一情形
P[/>-=
单谢情形
注2:/是抽取个观测值得到的样本均值至的标推差。GB/T 48892008
Prs-a]-α
注3:为方便使用,u1-/元和u1-a/2/在α=0.05及α=0.01下的值都在附录A的表A.1中给出。注:检验也可采用值的方法进行,见附录B。示例某制造商声称其生产的棉纱的平均断裂强度足一2.40.对此可进行检验。假设以前各批棉纱断裂强度的被动情况是稳定的,标推差是<=0.3315。设随机抽取了10个样品,测得棉纱的断裂强度,数据如下:2.297
根据表A的方法,检验的过程如下:2.362
GB/T 48892008
总体的技术特征:制造痴送达一批棉纱,共10000个线轴,分装在100个箱子里,每个箱子100个线轴,样本的技术特征;随机抽取 10 个箱了,每个箱子单随机抽取一:个线轴。在距线轴求端大约 5 m 处裁取 50 cM 长的棉纱作为测试材料,实际做实验时只取中间25cm。断裂强度的单位是N,副除或更正的观测值:无。
统计数据
样本量:
观测值和:
设定值:
n—10
2x,—21. 761
已知标准差:#=0.3315
显著性水平,α=0,05
双侧检验:
由附录 A 表 A. 1
(u.ms//10)a=0.6198X0.3315-0.20551元—μ [ - ↓ 2. 176 1-2. 40 =0. 223 9>0. 205 5在 01. 05 显著性水平下拒绝总体均值等于 2. 40 的慢设5.1.2方差未知的单总体均值的检验表A总体均值和设定值的比较(方差未知)总体的技术特征
样本的技术特征
剔除或更正的观测值
统计数据
样本盘:
观测值和:
观测值平方和:=
设定值:
自由度:
μ—n—1
显著性水平:α
双侧检验:
22(2-(2)/m
[sn]ti-.(v)-
[s/In]1-/2 (u)-
当—|>[-(时,拒绝总体均值与设定值相等的假设。单侧检验:
a)当—一「s/->时,拒绝总体均值不小于的假设;b)当一>[s/t1-(>时,拒绝总体均值不大于的假设。-1
注1,由自由度为的分布的α分位数)的定义,有。()=—-(),见下图:(mt
fa)2(]=t1-α/2[5)
1-a/2 () [)
P[1()≤t /2()]-1-
双侧情形
P[n)>h u()]-0
单情形
ta()--(u)
P[)-1-(]=α
注2:5/元基抽取个观测值得到的样本均假工的标难差的估计,即样本均值元的标准误。注3:为方便使用,,t1=/2()/元和11-()//n在α=0.05及a0.01下的值在附录A的表A.3中给出。GB/T 4889-2008
示例设需要解决的问题与5.1.1中的示例相同,但此时方差未知,必须从样本叶估计出来。这可能是因为没有以前留下的测量数据,或者认为它们已经不再适用了。使用表 A'的方法对 5. 1. 1 中的示例的数据进行分析:总体的技术特征:制造商送达一批棉纱,共10000个线轴,分装在100个箱子里,每个箱了100个线轴:样本的技术特征:随机拍取 10个箱子,每个箱子里随机拍取一个线轴。在距线轴末端大约 5 m 处裁取 50 cm 长的棉纱作为测试材料,实际做实验时只取中间 25 tm。断数强度的单位是N。期除或更正的观测值;无。
统计数据
样本:
观测值和:
Z;=21.761
观测值平方和:Z式—48.6105
设定值:
自由度
v-10--19
显著性水:2-0.05
双侧检验:
$18.610521,761/100. 139 6
s/ /10 0. 118 2
由附录A表A.2:
(s//10)20.9(9)0.1182×2.2622=0.2673[=—f / -- |2, 176 1 -2, 40 / -0. 223 9-20. 267 3在0.05显著性水平下不绝总体均值等于2.40的假设。注1:尽管未拒绝原假设,也不能确信制造商的声称是对的。注2:此处样本标准差5=0.3736比5.1.1中示例所用的标准差(c=0.3315)大,由于掌握的信息不可,得到的结论不同。
注3:当对由以往经验所得的方整是否仍然适用存在疑问时,使用方差的估计值会可靠一些,5.2单正态总体均值的区间估计
5.2.1方差已知的单总体均值的区间估计表B总体均值的区间估计(方差已知)总体的技术特征
样本的技术特征
剧除或更正的观测值
统计数据
样本蚤:
观测值和:
已知总体方差:。-
或标准:
置信水平:
E-- n'a=
[u-p/2 N0-
总体均值的点估计:一变一
双侧信区间一[-2/o+[:-a/a
单侧置信区间:μ[u-
或— +N
示例仍采用5.1.1中的示例中的数据。本例中,我们并不检验总体均值是不是等于某个设定值,而是要找到均值μ的置信水为1一α的置信区间,可以使用表B中的方法。此时还足假设总体方差已从历史数据中得到,为=0. 331 5.
GB/T 4889—2008
总体的技术特征:制造商送达一批梯纱,共 10 000 个线轴,分装在 100 个销于里,每个销子 1G0 个线轴。样本的技术待征:随机抽取10个箱了,每个箱子里随机抽取一个线轴。在原线轴末端大约5m处截取50cm长的棉纱作为测试材料,实际做实验时只取中间 25 cI。断裂强度的单位是 N。剔除或更正的观测值:无。
统计数据
样本:
观测值和:
己知标准差:www.bzxz.net
置信水:
2x,=21. 761
1—a0, 95
总体均值 μ的点估计:正一至=2. 176 1双侧置信区间:
由附录A表A,1.
(u. vs / V10)α= 0. 620 × 0. 331 5 - 0. 205 52. 176 1-0. 205 5;2. 176 1+0. 205 5即
1.97062.3816
5.2.2方差未知的单总体均值的区间估计表B
总体的技术特征
样本的技术特征
剧除或更正的观测值
统计数据
样本蛋:
观测值和:
观测价平方和:三-
自由度
置信水平:
总体均值的估计一元一
总体均值的区间估计(方差未知)计算
(-()/n
[snti--(-)=
[s/n_t-a/2 (u) -
双侧胃信区间—[s+1a()+[s//z()单侧受信区间:+[s/4n(v)
或 μz}-[sn't-a(t)
示例问题和5.2.1中的示例一样,只是此时要用估计值=s去代替。,并且使用1(或t//n)而不是(或u//斤)。使用表B'中的方法来求u的置信水平为0.95的置信区间。6
GB/T 4889—2008
总体的技术特征:制造商送达一批棉纱,共10000个线轴,分装在100个箱了里,每个箱子100个线轴。样本的技术特征:随机抽取10个箱子,每个箱子单随机抽取一个线轴。在距线轴未端大约5m处截取50cm长的棉纱作为测试材料,实际做实验时只取中间25cr。断裂强度的单位是N剔除或更正的观测值:无。
统计数据
样本量:
观测值和:
2;—21. 761
观测值平方和:元—48.6105
自由度
置信水平:
=10-1=9
1 =,95
总体均值μ的点估计—-2.1761
双侧置信区间:
2. 176 10. 267 3$2. 176 1+0. 267 3即
1. 908 8≤p2. 443 4
21,761 =2. 176 1
48.610521751/10=0.1396
s/ /10-0. 118 2
由附录 A表 A. 2;
(s/ /10) 0. 975 (9) = 0. 118 2 × 2. 282 2 =0.267 3
征1:本例中的置值区间期显要比方差[1知时的大,这是由于此处的样本标难差s-0. 373 6 比 5. 2. 1 中的示例所用的标准差(g一0.3315)大,由于掌操的信憨不同,得到的结论不同。注2:当对由以往经验所得的方差是否仍然适用存在问时,使用方差的估计值会可靠一些。注3:如果需要置信平更大一些的置信区间,可以取1一a一0.99,此时的区间会长一些。从附录 A表 A. 2 可得 t,99 (9) =3. 219 8 ,从而:(s/ /10)to.95 0. 118 2X3. 249 8= 0. 384 0因此,的置信水平为 0. 99 的置信区间是2. 176 1-0. 384 0≤±≤2, 176 1+0, 384 0即
6两正态总体均值的比较
6.1两总体均值比较的检验
1. 792 1s2. 560 1
6.1.1方差已知的两总体均值比较的检验表℃两个总体均值的比较(方差已知)总体1
的技术特征
总体2
样本1
样本2
样本1
样本2
的技术特征
中除或更正的观测值
统计数据
样本最:
观测值和:
样本1
已知总体方差:吃
显著性水乎-
样本2
GB/T 4889—2008
双侧检验:
表C(续)
当-->-成立时,护绝两均值相等的假设。单侧检验:
a)当至一一u。时,拒绝第一个均值不小于第二个均值的假设;b)当一≥~。成立时,拒绝第一个均值不大于第二个均值的假设。证:d= V/m,+7n基分别抽联 n;和 n2两组观测值得到的两个样本均值的差 d--,一±2的标准差示例仍考虑棉纱断裂强度的问题,随机抽取两种棉纱(分别是“棉纱1\和“棉纱2\)并测量其断裂强度,数据如下:
棉纱1:2.2972.5821.9492.3622.0402.1331.9861.6422.915
棉纱2:2.2862.3272,3883,1723.1582.7512.2222.3672.2472.5122.1042.707假设总体方差已从历史数据中得到:=0.1099,o,=0.3315
2 -0, 096 9,02 =0. 311 3
为对测种棉纱断裂强度均值的比较进行检验,来用表C提供的方法,得到:总体的技术特征:制造商A送达一批棉纱,共10000个线轴;制造商B也送达一批棉纱,其12000个线辑。这些棉纱都装在能容纳 1CO 个线轴的箱子里。样本的技术特征:从两批货物中分别随机抽取10和12个箱子,每个箱子单随机抽取一个线轴。在距线轴末竭大约5m处截取50cn长的棉纱作为测试材料,实际做实验时只取中间25cm。断裂强度的单位是N。别除或更正的观测值:无。
统计数据
样本1
样本量:n,=10
样本2
样本总和:211=21.761
≥22, 30. 241
总体方差: -0. 109 9, -0, 096 9显著性水平:α—C. 05
双情形:
—2, 176 1
0. 109 9 1 0. 096 ?
Ws. 975. 0d=1. 96 ×0. 138 1 =0. 27U 7[2. 176 12. 520 1. =0. 314 0>0. 271当显著性水平为C.05时拒绝源假设,即认为两个总体的均值并不相等。从样本均值看,第种棉纱的断裂强度更。
注:如果我们不愿意冒0.05这么大的错误决策的风险,可以取@一0.01,那么:o 95 * 0 =2. 575 8× 0. 138 1-0. 355 7在双削情形下:
[2. 176 12. 520 1| =0. 344 00. 355 7所以,在显著性水平一C.01时不能拒绝原假设。8
6.1.2方差未知但假设方差相等的两总体均值比较的检验表两个总体均值的比较(方差未知,但假设方差相等)总体
总体2』
的技术特征
样本11
的接术特征
样本2
样本1
>中别除或更正的观测值
样本2
统计数据
样本量:
样本 1
观测值和:
样本 2
观测值平方和:
自由度:
显著性水平:
双侧检验:
u= -n—2-
2(-)3 12(2)*
GB/T 4889—2008
[n, +n2 2(1 -)*+2( -3))
t.--(s --
当|—>/()时,拒绝两均值相等的假设单侧检验:
mt-+-nz 2
或 ti-a/()—
a)当一一:,(sa时,拒绝第一个均值不小于第二个均值的假设;b)当一>-(时,拒绝第-个均值不大于第均值的假设。注: 5:是分别抽取 , 和 n两组观测值得到的两个样本均值的差 d-工, 一,的标准差的估计,即 d 的标准误。示例考虑与 6. 1. 1 示例同样的向题,实际中,总体方差与己知的情况是很少发生的,因此,有必要通过样本数据获得方差的估计。需要注意的是,只有当两总体方葬相等时,采用表 C的方法对两总体均值的比较进行检验才是妥当的。这望,我们假设 6. 1.1 中示例中的两种棉纱方差相等。对于6.1.1中示例中给山的两个棉钞样本,采用表C'提供的方法,有:总体的技术特征:制造商 A送达一批棉纱,共 10 000 个线轴+制适商 B也送达-批棉纱,共 12 000 个线轴。这些棉纱都装在能容纳 100 个线轴的箱子里。样本的技术特征:从两批货物中分别随机抽取10和12个箱子,每个箱子里随机抽取一个线轴,在距线轴末端大约5m处截取50cm长的棉纱作为试材料,实际做实验时只取中问25cm。断裂强度的单位是N。划陈或更正的观测值:无。
统计数据
样本量:
样本1
样本2
观测值和:21-21.7612=30.241
观测值半方和:习—1.256 4—1.389 8自由度:
+=10+12-220
显著性水平:0=0.05
双侧情形:
, - 2. 175 1, x2 = 2. 520 1
2(x1. -1)3 -1-2(T2: -22)*-2. 646 1222.6461=0.155 7
10×1220
5utu.35 (20) --0. 155 7×2. 086=0. 324 8[2. 176 1 -2. 520 1 =0. 344 0>0. 324 H当显著也水平为0.05耐拒绝原假设,即认为两个总体的均值并不相等。从样本均值看,第二种棉纱的断翌强度更大,
注如果我们不愿意骨0.05这么大的错误决策的风险,可以取=0.0t,那么:to.995(20)5g=2.8453X0.1557-0.4430在双侧情形下:
2. 176 12. 520 1|=0. 344 0<0. 443 0所以,在显著性水平 α=0, 01 时不能拒绝原设。9
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。