标准号: GB/T 3358.1-1993
中文名称:统计学术语 第一部分:一般统计术语
标准类别:国家标准(GB)
英文名称:Terms for statistics. Part Ⅰ: Terms for general statistics
标准状态:已作废
发布日期:1993-08-28
实施日期:1994-05-01
作废日期:2010-02-01
出版语种:简体中文
下载格式:.rar.pdf
下载大小:907664
标准ICS号:社会学、 服务、公司(企业)的组织和管理、行政、运输>>质量>>03.120.30统计方法的应用
中标分类号:综合>>基础学科>>A41数学
出版社:中国标准出版社
页数:31页
标准价格:16.0 元
出版日期:1994-05-01
首发日期:1982-12-30
复审日期:2004-10-14
起草人:陈希孺、陶波、冯士雍、吴启光
起草单位:全国统计方法应用标委会
归口单位:全国统计方法应用标准化技术委员会
提出单位:全国统计方法应用标准化技术委员会
发布部门:国家标准化管理委员会
主管部门:国家标准化管理委员会
2.47 泊松分布 Poisson distribution一种离散概率分布,其概率函数为P(X - ) - e
式中 >0。wwW.bzxz.Net
注:泊松分布的期望和方差都是入。2.48超几何分布hypergeometricdistribution种离散概率分布,其概率函数为P(X = )
x 0,l,...
式中NM(≤N),n(≤N)是正整数,r为整数,其取值范围为max(O,n十M-N)rmin(M,n)
二维正态分布
bivariate normal distribution2.49
种连续二维概率分布,其密度函数为f(a,y)
式±1AF8
2noroy Vi- p?
2(1 — p2)L
(()+【)
—201
uxa.>o,>o,1o1
注:(i)X和Y的边缘分布都是正态分布,其期望分别为和μy,标准差分别为,和是X和Y的相关系数。
②这-概念可推广到(k>2)维情形。2.50
多项分布muitinomial distribution-种离散多维概率分布,其概率函数为P(X,
21****,X+ *)
.o,1n,(i= Ik),
式中p0(i-1,2,k),
3基本统计术语
3.1个体itcm,individual
GB/T 3358.193
可以单独观测和研究的一个物体、一定量的材料或一次服务。也指表示上述物体、材料或服务的个定量或定性的特性值。
3.2 总体 population
一个统计间题中所涉及个体的全体。3.3总体分布populationdistribution当个体理解为定量特性值时,总体的每一个体可看成是某一确定的随机变量的一个观测值,称这个随机变量的分布为总体分布。3.4 特性 characteristic
所考察的定性或定量的性质或指标。注:特性在任一特定个体上的值称为特性值。3.5样本sample
按一定程序从总体中抽取的一组(一个或多个)个体(或抽样单元,见5.2)。注:①样本中的每个个体有时也称为样品。②若样本是按某种随机方式抽取的,则样本可以看成是一组随机变量,其中每个随机变量也称为样本分量。
3.6抽样sampling
从总体中抽取样本。
3.7样本量sample size
样本中所包含的个体(或抽样单元)的数日。3.8独立同分布样本independently identically distributed sample分量的分布与总体分布相同且各分量相互独立的样本。注:在数理统计中,独立同分布样本通常称为简单随机样本(simplerandom sanuple)。在使用此术语时,要注意与5.7中的术语相区别。
3.9观测值observedvaluc
作为一次观测结果而确定的特性值。3.10组 class
对于定量特性,将该特性的整个变化区间分成相连接而不重叠的若小区间,这种小区间称为组。
3.11 组限 class limits
组的上、下界限。
注:应明确规定上、下限中的哪一个属于该组。组中值 tnid-point of class
组的上、下限的算术平均值。
B 组距 class width
组的上、下限之差。
3.14频数absolute frequency
多次观测中一给定事件发生的次数,或落入一特定纽的观测值个数。3.15
累积频数 cumulative absolute frcquency在定量特性情形,小于或等于某给定值,或某给定组的上限的观测值个数37
3.16频率relative frequency
频数与试验或观测总次数之比。GB/T 3358.1—93
3.17累积频率cumulative Ielative frequency累积频数与试验或观测总次数之比。3.18直方图histogram
连续随机变量观测值分布状况的种图形表示。在横坐标轴上将该随机变量的值区间分为组分别以各组为底作矩形,其面积等于相应组的频率(频数)。注:以频率(频数)表示的直方图称为频率(频数)直方图。3.19条形图 bar chart
离散随机变量观测值分布状况的一种图形表示,在一坐标轴上点出观测值的数值,分别从这些点出发向问一方向作与该坐标轴垂直的线条,其长度等于相应的观测值的频率(频数)。3.20散点图scattcr diagram
两个随机变量的每一对观测值用直角坐标平面上的一个点表示所成的图形。列联表 contingency table
观测数据按两个或更多定性特性分类时所列出的频数表。注:对于定量特性,若将它们按其值分成组,也可列出列联表。3.22统计量 statistic
样本的函数,它不依赖于未知参数。3.23样本均值 sample mcan
样本X,,,X,的算术平均数:
3.24次序统计量order statistics将样本的各分量从小到大排列成Xa)X(2)\,X(m),称(Xcn)X(2)X(n)为次序统计量.X称为第:个次序统计量。
3.25样本中位数samplemedian
当样本量n为奇数时,样本中位数是第(n十1)/2个次序统计量;当n为偶数时,是第n/2个与第n/2十1个次序统计量的算术平均数。3.26中程数nidrange
样本中最大值与最小值的算术平均数:(X) +X(n) /2。
3.27极差range
样本中最大值与最小值之差:
Xn) -- Xuo
3.28平均绝对差meandeviation
样本分量与样本均值之绝对差的算术平均数,。
3.29样本方差sample variance
GB/T 3358.1-93
样本分量与样本均值之差的平方和,除以样本量减1:S2
其中n-1为自由度。
>)(X, X)2,
注:当涉及多个随机变量时,可用下标表明相应的随机变,例如记X的方差为S,3.30样本标准差sample standard deviation样本方差的正平方根。
样本变异系数sample coefficient of variation3.31
样本标准差与样本均值的绝对值之比。3.32
样本协方差sample covariance
二维样本(X,Y),(X2,Y),,X,Y,)的样本协方差是:Sxr
- X)(Y:- Y)。
3.33 样本相关系数sample correlation coefficient二维样本(X,,Y),(X2,Y2),\,X,Y,)的样本相关系数是:(X;
X)(Y, Y)
(X:-x)a
3.34经验分布empirical distributionC(YY)
对样本X,Xz,,X,的每个分量X,赋予相等概率1/n所得的概率分布。经验分布的分布函数称为经验分布函数:[o,r
注:①对取定的组样本观测值1
“\,经验分布是一个确定的离散分布。②对任意给定的数值x,F()是样本的函数,它是一个统计量。3.35样本矩sample moment
经验分布的矩。
例1:对样本X,,X2X,及正整数g,样本g阶原点矩是指1x
当g=1时,即样本均值×。
例2:对样本XX,\,X,及正整数.样本阶中心矩是指(x, X),
当9=2时,即样本二阶中心矩
其中S是样本方差。
GB/T 3358.1 -93
1(x, -x)=\=Is*.
3.36经验回归方程empirical regression equation根据样本,对回归方程所作的估计(见3.40)。其图形称为经验回归曲面或经验回归曲线经验回系数empirical regression coefficient3.37
经验回归方程中相应变量的系数。它是根据样本对何归系数作出的估计。3.38
游程run
在属性观测的系列中,同属性的不间断的完整子系列。例:在表示为“”,“二”两种属性的以下观测系列中十十一十一“十”游程,3个“一”游程。
3.39估计estirmation
根据样本推断总体分布的未知成分,例如参数。3.40
估计量estimator
用以估计总体分布未知量的统计量。估计值estimate
根据样本观测值,对估计量的计算结果。估计量的偏倚bias of estimator3.42
估计量的期望与被估未知量真值之差。3均方误差mean square error
估计量与被估未知量真值之差平方的期望。注:估计量的均方误差等于估计量的方差与其偏倚的平方之和。3.44抽样误差samplingerror
由于样本的随机性而产生的误差。3.45无偏估计量unbiased estimator期望等于被估未知量真值的估计量。3.46标准误差standard error
估计量的标准差。
注:标准误差通常用于估计量是无偏的或近似无偏的情形。3.47双侧置信区间two-sided confidence interval+
-+++共有4个
若0是要估计的总体分布未知量,T,≤T是两个统计量,使区间[T.T,]以一定概率包含0.则称此区间是0的-一个双侧置信区间。T,和T1分别称为置信区间的上、下限。3.48单侧置信区间 one-sided confidence interval在置信区间[T,,T]中,当上限T,为×或未知量的上限,或者当下限T为-×或未知量的下限时,称该置信区问为单侧置信区间。此时,对于前者,T,称为置倍下限;对于后者,T称为置信上限。
9置信水平confidence level
[T,1,]是的-个双侧或单侧置信区间,1一α是0和1之问的常数,若对切9,有P(T≤≤T)1α,
则称1一α为该置信区间的置信水乎。注:()当P(T≤=T2)1—α时,1-α也常称为置信系数或置信度。②)置信水平1一α通常取接近于1的值,如0.90,0.95,0.99等40
GB/T 3358.1—93
3.50统i覆盖区问 statistical coverage interval出满足T≤T,的两个统计量构成的区间[7\,T:,它以不低于的概率至少包含总体的…-确定比例3.即
PEF(T)-F(T)βJY
则称此区间为总体分布F(x)的(β.\)统计覆盖区间,T,T,分别称为该统计覆盖区问的上、下限。
3.51拟含优度goodncss of fit
观测值与事先假定的分布(模型)之间的符合程度的数值刻画。3.52
离群值outlier
样本中的…个或几个观测值,它们离开其他观测值较远,暗示它们可能来白不同的总体。3.53
3统计假设statisticalhypothesis关于一个或多个总体分布的命题,它可以通过样本去进行检验。3.54
统计检验 statistical test
根据样本,决定某个统计假设应该被拒绝或不被拒绝(接受)的方法和步骤。3.55原假设与备择假设null hypothesis and alternativehypothesis原假设II。是一个特定的统计假设,对它要作出拒绝或接受的决定。异于原假设,且在原假设被拒绝时可能采用的统计假设称为备择假设。例1:关于假设期望不小于给定值的检验问题可表述为:H, u= μo-H: tpoo
例2:关于假设两批产品不合格品率相等(但未知)的检验问题可表述为:H:=2→H:p≠p20
例3:关于假设总体分布为正态分布(参数不确庭)的检验问题,备择假设为总体分布不是正态的。
例4:关于泊松分布中参数入等于给定值(>0)的检验问题可表述为:H:AH:A+
3.56简单假设simple hypothesis完全确定了总体分布的统计假设。注:3.55条的例4中的1。是简单假设。3.57复合假设composite hypothesis不完全确定总体分布的统计假设。例1:在正态分布N(,)的假定下,当标准差已知时,假设α一是简单假设,而当α未知时,则是复合假设。
例2:在3.55条的例中给出的前三个统计假设都是复合假设。3.58检验统计量test statistic取值决定一个统计假设被拒绝与否的统计量。3.59非参数检验non-parametric test当一个统计假设不能用有限个参数来描述时所采用的检验方法。例:检验一个样本是否来自某一分布的柯尔莫哥洛夫检验。3.60拒绝域rcjection region
检验统计量取值的一个集合,如果该统计量的观测值属于这个集合,则源假设被拒绝;否测.原假设不被拒绝,拒绝域也称为否定域。3.61 临界值i critical value
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。