首页 > 国家标准(GB) > GB/T 3358.1-1993 统计学术语 第一部分:一般统计术语
GB/T 3358.1-1993

基本信息

标准号: GB/T 3358.1-1993

中文名称:统计学术语 第一部分:一般统计术语

标准类别:国家标准(GB)

英文名称:Terms for statistics. Part Ⅰ: Terms for general statistics

英文名称:Terms for statistics. Part Ⅰ: Terms for general statistics

标准状态:已作废

发布日期:1993-08-28

实施日期:1994-05-01

作废日期:2010-02-01

出版语种:简体中文

下载格式:.rar.pdf

下载大小:KB

标准分类号

标准ICS号:社会学、 服务、公司(企业)的组织和管理、行政、运输>>质量>>03.120.30统计方法的应用

中标分类号:综合>>基础学科>>A41数学

关联标准

替代情况:GB 3358-1982

采标情况:ISO/DIS 3435.1,REF;ISO/DIN 3435.2,REF;ISO/DIN 3435.3,REF

出版信息

出版社:中国标准出版社

页数:31页

标准价格:16.0 元

出版日期:1994-05-01

相关单位信息

首发日期:1982-12-30

复审日期:2004-10-14

起草人:陈希孺、陶波、冯士雍、吴启光

起草单位:全国统计方法应用标委会

归口单位:全国统计方法应用标准化技术委员会

提出单位:全国统计方法应用标准化技术委员会

发布部门:国家标准化管理委员会

主管部门:国家标准化管理委员会

标准简介

本标准规定了常用的数理统计术语。本标准适用于各类标准与技术文件中涉及的数理统计术语。对各类研究技术报告和著作中涉及的数理统计术语也应参照使用。 GB/T 3358.1-1993 统计学术语 第一部分:一般统计术语 GB/T3358.1-1993 标准下载解压密码:www.bzxz.net
本标准规定了常用的数理统计术语。 本标准适用于各类标准与技术文件中涉及的数理统计术语。对各类研究技术报告和著作中涉及的数理统计术语也应参照使用。


标准图片预览






标准内容

中华人民共和国国家标准
统计学术语
第一部分一般统计术语
Terms for statistics
---Part I : Terms for general statistics1主题内容与适用范围
本标准规定了常用的数理统计术语。GB/T3358.1-·93
代背GR3358:82
本标准适用于各类标准与技术文件中涉及的数理统计术语,对各类研究技术报告和著作中涉及的数理统计术语也应参照使用。
2概率论术语
2.1概率probability
度量一随机手件发生可能性大小的实数,其值介于0与1之间。注:随机事件的概率可看作在相同条件下重复试验时,该事件发生的频率的稳定值,也可看作对事件发生的相信程度:
2.2「一维〗随机变量
[univariate] random variable,variate取值随试验结果而定,且有一定的概率分布的变量。2.3【--维]概率分布[univariate】probabilitydistribution给出··个随机变量取任何给定值或取值于任何给定集合的概率的函数,随机变址在其整个变化区域取值的概率为1。
2.4[--维分布函数(univariate】 distribution function随机变量X小于或等于实数的概率,它是的函数:F(α) = P(X ≤T)
注;F(r)是右连续的。有时也把Fr)P(Xn)定义为分布函数·此时F(r)是左连续的。2.5连续随机变量及概率]密度函数continuous random variablc and [probability’density funotion
如果随机变量的分布函数F(x)可表示为一非负函数()的积分:F(α)=
f(t)dt
则称该随机变量为连续随机变量,F(α)称为它的[概率]密度函数。任何密度函数f()必满足
f(r)dx = 1
注:连续随机变量的概率分布称为连续分布。2.6离散随机变量及概率函数discreterandom variablc and probabilityfunction只能取有限或可列个值(·2,)的随机变量X称为离散随机变量。给出X取可能值的国家技术监督局1993-08.28批准30
19940501实施
概率的函数称为概率函数:
任何概率涵数必满足=1。
GB/T3358.193
p, P(X -r,).i - 1,2,...
注:离散随机变量的概率分布称为离散分布。2.7 维随机变量k-dimensional random variable取值随试验结果而定、且有·定的维概率分布的表维向量:X- (X,,X2,--,X.).
2.8维概率分布k-dimcnsional probability distribution给出--个维随机变量取值于k维空间中任何给定集合的概率的函数。灵维(三2)概率分行也称为个随机变量的联合分布。
注:(D维空间上的实值函数
F(r;r,,r) P(X, sai+X r.,X a)称为维随机变量X-(X,X..X.)的联合分布数。②如果维随机变量的分布函数F()可表示为一非负函数r.)的积分:Fa+ - . taddt
则称该维随机变量为专维连续随机变量ri,s,的分布称为维连续分布。
称为它的概率门密度函数。维连续随机变量只能取有限或可列组值(x2,,)的维随机变量称为维离散随机变量,给出它取每组可能值(i\a)的概率的函数称为维概率函数。p, = P(X, - x,\,X = x.),i - I.2,..表维离散随机变量的分布称为维离散分布。2.9 边缘分布 marginal distribution维随机变量的力个分量的联合分布,称为该后维随机变量的分布的力维边缘分布。例:维随机变量(X,Y,Z)含有:-三个二维边缘分布,即(X,Y),(X,Z)和(Y,Z)的分布;三个维边缘分布,即X,Y和Z的分布。2.10条件分布conditional distribution表维随机变量的力个分量在另外是一P个分量取给定值条件下的联合概率分布。2.11 独立 independence
若两组随机变量有联合概率分布,其任何-组的条件分布都不随另一组的取值而变化,则称它们是独立的。否则称它们是相依的(dependence)。注:(i)若两组随机变量(X,X)和(Yi,…,Y,)是独立的,则对任意(,)和(y.)都有F(rirmyi+.yh) = Fi(a+,arn)F(yi.**+y),式中F(.rm)与F(,)分别为(X,.X)和(Y...Y.)的分布函数,F(..r..)为它们的联合分布雨数。
对密度函数和概率函数,类似公式也成立。上述概念可以推广到组随机变的情形。2.12 分位数quantile
对随机变量,满足条件(X<)≤和PX≤)=的实数称为的战其分布的分位数。
注:(1)分位数可以不唯-
2)与m.分别称为上,下四分位数(quartile)2.73 中位数 median
随机变量或它的概率分布的0.5分位数。2. 14众数 modc
GB/T 3358.1-93
密度函数或概率函数达到极大值的点。注:若众数只有一个,则该概率分布称为单峰的。2.15期望expectation
对以概率p;取值\,的离散随机变量X,其期望定义为:a.
式中是对X的所有可能值;求和。Sp,r
对密度函数为f(r)的连续随机变量X,其期望定义为:b.
随机变量的期望也称为它的概率分布的期望。同义词:均值
注:上述求和与积分部要求绝对收敛,条件期望conditional expectation2.16
随机变量的条件分布的期望。
中心化随机变量central random variable2.17
随机变量X与其期望之差:X-E(X)。注:中心化的目的是为使随机变量的期望为零。2.18方差variance
随机变量X的方差定义为:
f(r)da
V(X) = E[(X - E(X))27。
它亦称为X的分布的方差。
9标准差standard deviation
方差的正平方根V(X)
2.20 变异系数 cocfficient of variation标准差与期望的绝对值之比VV(X)/IE(X)I。2.21标准化随机变量standardized random variable中心化随机变量X-E(X)与其标准差之商:X - E(X)
注:标准化的目的是为使随机变量的期望为0.方差为1。2.22 矩 moment
随机变量幂函数的期望。
2.23 原点矩 moment about the origin随机变量X的q阶原点矩(q是正整数)是指X的4次幂的期望:E(X\)。
注:一阶原点矩即是期望。
2.24 中心矩 central moment
随机变量X的阶中心矩(g是正整数)是指:Er(X - E(X))\].
注:二阶中心矩即是方差,
2.25联合短joint moment
GB/T 3358.1—93
维随机变量(X,Y)的(4.s)阶联合原点矩(4+s皆为正整数)是指:E(X'Y)
维随机变量(XY)的(\s)阶联合中心短是指:Er(X - E(x))\(Y -- E(Y))\..注:可类似定义多维随机变量的联合矩。2.26协方差covariance
二维随机变基(X,Y)的协方差是指其(1,1)阶联合中心矩:E(Y)>)J.
Ca(X,Y) -- Fr(X -- E(X))(Y --2.27相关系数correlation coeficicnt一维随机变量X,Y)的相关系数,是指其协方差与X、Y的标准差乘积之比:Q
当(三0时,称此两随机变地不相关,2.28 绝对短 absolute momcnt
Ce(X,Y)
wv(x)v(y)
在2.23条至2.25条关F矩的定义中X.X一E(X),Y,Y一E(Y)等量分别以其绝对值IX/:X--E(X)I.IYI,IY-E(Y)I等代替,这样定义的矩称为相应的绝对矩。注:对于绝对矩和,为止数.但不必为整数。例1:X的q阶绝对中心矩是指:
E[IX- E(X))
例2:(X,Y)的(q.s)阶联舍绝对原点矩是指:E(IXYI)。
2.29峰度kurtosis 
随机变量的概率分布的峰度是相应标准化随机变量的4阶原点矩减3.它描述了该标准化随机变量的分布的陡峭程度。
例:正态分布的峰度为0。
偏度skewness
随机变量的概率分布的偏度是相应标准化随机变量的3阶原点矩,它描述了该分布的非对称程度。
注:偏度为时,分布称为对称的;偏度不为0时,分布称为偏斜的。当偏度为正时,称为石偏;偏度为负时,称为左偏。
例:正态分布的偏度为0。
2.31回函数,间归方程与问明系数regrcssion function,rcgression equaliou and rcgression couf.ficient
若是-随机变量,X是-维随机变堆,则给定X=(\,,)时的条件期望\?,作为,,的函数,称为对的回州函数。此时二了,称为方程,回归函数的图形称为回归曲面。当回归曲面是一超平面y= b +h + b? +* +h*
时回称为线性的,此时6;称为Y对X,的偏间归系数(=1.2,,)。X是-维随机变量时,Y对X的间归函数f)的图形称为回归曲线,当Y对X的回册线是:·直线y=αbr时,称为回归直线,其斜率h称为Y对x的归系数,2.32均匀分布 uniform distribution种连续概率分布,其密度函数为33
2.33正态分布normal distributionGB/T 3358.1-93
f(α)
-种连续概率分布,其密度函数为f()=
代ux.0Y2元。
注:《和。分别为正态分布的期望与标准差。当a
其他。
2.34标准正态分布standardized normaldistribution标准化正态随机变量的分布,其密度函数为:)
2.35 x分布 chi-square distributioncexpl
·种连续概率分布,其密度函数为:2
2/r(v/2)exp(
f(α)
式中为正整数,称为分布的自由度。),0.
注:白出度为时的分布是个相互独立的标准正态随机变量平方和的分布。2.36t分布t-distribution,Student's distribution一种连续概率分布,其密度函数为:E(v + 1)/2])
式中0称为分布的自出度,
/rr(/2)
(w+1:
注:白由度为正整数时的,分布是两个独立随机变量之商的分布。分子是标准正态随机变量,分得出度为的分布随机变量被其白由度除所得商的正平方根。2.37 分布 F-distribution
种连续概率分布,其密度函数为:(/2)-1
F[( +-v2)/2]
(/2)2)/
(+ ≥ 0,
式中为正整数,分别称为分布的第自由度与第二自出度注:白由度为以,地的F分布是两个独立的随机变量之商的分布,分子和分母都是x分布随机变证除以各自的自由度
2.38对数正态分布log-normal distribution种连续概率分布.其密度函数为:f(r) =
V2元a
GB/T 3358.1--93
注:D若X是对数正态分布,则InX的概率分布是期望为μ标准差为α的正态分布。(②)(r)中的自然对数ln可用常用对数ig代替,此时,0.434.3exp
V2元0
1igr±i2
③上述密度函数中可用一≥)代替,从而得到推广。此时,为位置参数。2.39指数分布exponential distribution一种连续概率分布,其密度函数为:f(r) Ae-,r ≥ 0,
式中≥0
注:上述密度函数中可用一()代替,从而得到推广。此时,为位置参数。2.40 f 分布 gamma distribution-种连续概率分布,其密度函数为:f(r)=
F(α)β
式中α>0,β>0分别称为分布的形状参数与尺度参数,而r(α)
a-le-rdr。
注:上述「分布密度函数中可用工一)代替x,从而得到推广,此时?称为位置参数。②参数为α/2,B2的分布,即是自由度为的×分布。2.41 B分布 beta distribution种连续分布,其密度函数为:
F(α+β)
f(α) =
a-1(1— )-1,0<<1
r(a)r(p)u
式中α>0.β>0为分布的形状参数。2.42I 型极值分布 type I extreme value distribution, Gumbel distribution-种连续概率分布,其分布函数为:F(r) = exp[ e-(-i], co a cx.式中β0,αA8。
2.43I 型极值分布 type I extreme value distribution, Frechet distribution-种连续概率分布,其分布函数为F() expt-[(r )/p]a),α,
式中α>0,β>0,-
2.44威布尔分布Weibull distribution,type I extreme value distribution-种连续概率分布,其分布函数为F() 1 expl
式中α0.β>0,一<分别称为分布的形状参数,尺度参数与位留参数2.45项分布 binomial distribution35
GB/T 3358.1-93
种离散概率分布,其概率函数为P(X =)=
!(n=r)!
n .*(1 - p)-, 0.l,..
2.46负二项分布negativebinomial distrihution-种离散概率分布,其概率函数为P(X = ) - c+1)+-p(1 p) = .1...!
式中>0,02.47 泊松分布 Poisson distribution一种离散概率分布,其概率函数为P(X - ) - e
式中 >0。
注:泊松分布的期望和方差都是入。2.48超几何分布hypergeometricdistribution种离散概率分布,其概率函数为P(X = )
x 0,l,...
式中NM(≤N),n(≤N)是正整数,r为整数,其取值范围为max(O,n十M-N)rmin(M,n)
二维正态分布
bivariate normal distribution2.49
种连续二维概率分布,其密度函数为f(a,y)
式±1AF8
2noroy Vi- p?
2(1 — p2)L
(()+【)
—201
uxa.>o,>o,1o1
注:(i)X和Y的边缘分布都是正态分布,其期望分别为和μy,标准差分别为,和是X和Y的相关系数。
②这-概念可推广到(k>2)维情形。2.50
多项分布muitinomial distribution-种离散多维概率分布,其概率函数为P(X,
21****,X+ *)
.o,1n,(i= Ik),
式中p0(i-1,2,k),
3基本统计术语
3.1个体itcm,individual 
GB/T 3358.193
可以单独观测和研究的一个物体、一定量的材料或一次服务。也指表示上述物体、材料或服务的个定量或定性的特性值。
3.2 总体 population
一个统计间题中所涉及个体的全体。3.3总体分布populationdistribution当个体理解为定量特性值时,总体的每一个体可看成是某一确定的随机变量的一个观测值,称这个随机变量的分布为总体分布。3.4 特性 characteristic
所考察的定性或定量的性质或指标。注:特性在任一特定个体上的值称为特性值。3.5样本sample
按一定程序从总体中抽取的一组(一个或多个)个体(或抽样单元,见5.2)。注:①样本中的每个个体有时也称为样品。②若样本是按某种随机方式抽取的,则样本可以看成是一组随机变量,其中每个随机变量也称为样本分量。
3.6抽样sampling
从总体中抽取样本。
3.7样本量sample size
样本中所包含的个体(或抽样单元)的数日。3.8独立同分布样本independently identically distributed sample分量的分布与总体分布相同且各分量相互独立的样本。注:在数理统计中,独立同分布样本通常称为简单随机样本(simplerandom sanuple)。在使用此术语时,要注意与5.7中的术语相区别。
3.9观测值observedvaluc
作为一次观测结果而确定的特性值。3.10组 class
对于定量特性,将该特性的整个变化区间分成相连接而不重叠的若小区间,这种小区间称为组。
3.11 组限 class limits
组的上、下界限。
注:应明确规定上、下限中的哪一个属于该组。组中值 tnid-point of class
组的上、下限的算术平均值。
B 组距 class width
组的上、下限之差。
3.14频数absolute frequency
多次观测中一给定事件发生的次数,或落入一特定纽的观测值个数。3.15
累积频数 cumulative absolute frcquency在定量特性情形,小于或等于某给定值,或某给定组的上限的观测值个数37
3.16频率relative frequency
频数与试验或观测总次数之比。GB/T 3358.1—93
3.17累积频率cumulative Ielative frequency累积频数与试验或观测总次数之比。3.18直方图histogram
连续随机变量观测值分布状况的种图形表示。在横坐标轴上将该随机变量的值区间分为组分别以各组为底作矩形,其面积等于相应组的频率(频数)。注:以频率(频数)表示的直方图称为频率(频数)直方图。3.19条形图 bar chart
离散随机变量观测值分布状况的一种图形表示,在一坐标轴上点出观测值的数值,分别从这些点出发向问一方向作与该坐标轴垂直的线条,其长度等于相应的观测值的频率(频数)。3.20散点图scattcr diagram
两个随机变量的每一对观测值用直角坐标平面上的一个点表示所成的图形。列联表 contingency table
观测数据按两个或更多定性特性分类时所列出的频数表。注:对于定量特性,若将它们按其值分成组,也可列出列联表。3.22统计量 statistic
样本的函数,它不依赖于未知参数。3.23样本均值 sample mcan
样本X,,,X,的算术平均数:
3.24次序统计量order statistics将样本的各分量从小到大排列成Xa)X(2)\,X(m),称(Xcn)X(2)X(n)为次序统计量.X称为第:个次序统计量。
3.25样本中位数samplemedian
当样本量n为奇数时,样本中位数是第(n十1)/2个次序统计量;当n为偶数时,是第n/2个与第n/2十1个次序统计量的算术平均数。3.26中程数nidrange
样本中最大值与最小值的算术平均数:(X) +X(n) /2。
3.27极差range
样本中最大值与最小值之差:
Xn) -- Xuo
3.28平均绝对差meandeviation
样本分量与样本均值之绝对差的算术平均数,。
3.29样本方差sample variance
GB/T 3358.1-93
样本分量与样本均值之差的平方和,除以样本量减1:S2
其中n-1为自由度。
>)(X, X)2,
注:当涉及多个随机变量时,可用下标表明相应的随机变,例如记X的方差为S,3.30样本标准差sample standard deviation样本方差的正平方根。
样本变异系数sample coefficient of variation3.31
样本标准差与样本均值的绝对值之比。3.32
样本协方差sample covariance
二维样本(X,Y),(X2,Y),,X,Y,)的样本协方差是:Sxr
- X)(Y:- Y)。
3.33 样本相关系数sample correlation coefficient二维样本(X,,Y),(X2,Y2),\,X,Y,)的样本相关系数是:(X;
X)(Y, Y)
(X:-x)a
3.34经验分布empirical distributionC(YY)
对样本X,Xz,,X,的每个分量X,赋予相等概率1/n所得的概率分布。经验分布的分布函数称为经验分布函数:[o,rXm≤r(1,r≥X(n)
注:①对取定的组样本观测值1
“\,经验分布是一个确定的离散分布。②对任意给定的数值x,F()是样本的函数,它是一个统计量。3.35样本矩sample moment
经验分布的矩。
例1:对样本X,,X2X,及正整数g,样本g阶原点矩是指1x
当g=1时,即样本均值×。
例2:对样本XX,\,X,及正整数.样本阶中心矩是指(x, X),
当9=2时,即样本二阶中心矩
其中S是样本方差。
GB/T 3358.1 -93
1(x, -x)=\=Is*.
3.36经验回归方程empirical regression equation根据样本,对回归方程所作的估计(见3.40)。其图形称为经验回归曲面或经验回归曲线经验回系数empirical regression coefficient3.37
经验回归方程中相应变量的系数。它是根据样本对何归系数作出的估计。3.38
游程run
在属性观测的系列中,同属性的不间断的完整子系列。例:在表示为“”,“二”两种属性的以下观测系列中十十一十一“十”游程,3个“一”游程。
3.39估计estirmation
根据样本推断总体分布的未知成分,例如参数。3.40
估计量estimator
用以估计总体分布未知量的统计量。估计值estimate
根据样本观测值,对估计量的计算结果。估计量的偏倚bias of estimator3.42
估计量的期望与被估未知量真值之差。3均方误差mean square error
估计量与被估未知量真值之差平方的期望。注:估计量的均方误差等于估计量的方差与其偏倚的平方之和。3.44抽样误差samplingerror
由于样本的随机性而产生的误差。3.45无偏估计量unbiased estimator期望等于被估未知量真值的估计量。3.46标准误差standard error
估计量的标准差。
注:标准误差通常用于估计量是无偏的或近似无偏的情形。3.47双侧置信区间two-sided confidence interval+
-+++共有4个
若0是要估计的总体分布未知量,T,≤T是两个统计量,使区间[T.T,]以一定概率包含0.则称此区间是0的-一个双侧置信区间。T,和T1分别称为置信区间的上、下限。3.48单侧置信区间 one-sided confidence interval在置信区间[T,,T]中,当上限T,为×或未知量的上限,或者当下限T为-×或未知量的下限时,称该置信区问为单侧置信区间。此时,对于前者,T,称为置倍下限;对于后者,T称为置信上限。
9置信水平confidence level
[T,1,]是的-个双侧或单侧置信区间,1一α是0和1之问的常数,若对切9,有P(T≤≤T)1α,
则称1一α为该置信区间的置信水乎。注:()当P(T≤=T2)1—α时,1-α也常称为置信系数或置信度。②)置信水平1一α通常取接近于1的值,如0.90,0.95,0.99等40
GB/T 3358.1—93
3.50统i覆盖区问 statistical coverage interval出满足T≤T,的两个统计量构成的区间[7\,T:,它以不低于的概率至少包含总体的…-确定比例3.即
PEF(T)-F(T)βJY
则称此区间为总体分布F(x)的(β.\)统计覆盖区间,T,T,分别称为该统计覆盖区问的上、下限。
3.51拟含优度goodncss of fit
观测值与事先假定的分布(模型)之间的符合程度的数值刻画。3.52
离群值outlier
样本中的…个或几个观测值,它们离开其他观测值较远,暗示它们可能来白不同的总体。3.53
3统计假设statisticalhypothesis关于一个或多个总体分布的命题,它可以通过样本去进行检验。3.54
统计检验 statistical test
根据样本,决定某个统计假设应该被拒绝或不被拒绝(接受)的方法和步骤。3.55原假设与备择假设null hypothesis and alternativehypothesis原假设II。是一个特定的统计假设,对它要作出拒绝或接受的决定。异于原假设,且在原假设被拒绝时可能采用的统计假设称为备择假设。例1:关于假设期望不小于给定值的检验问题可表述为:H, u= μo-H: tpoo
例2:关于假设两批产品不合格品率相等(但未知)的检验问题可表述为:H:=2→H:p≠p20
例3:关于假设总体分布为正态分布(参数不确庭)的检验问题,备择假设为总体分布不是正态的。
例4:关于泊松分布中参数入等于给定值(>0)的检验问题可表述为:H:AH:A+ bzxz.net
3.56简单假设simple hypothesis完全确定了总体分布的统计假设。注:3.55条的例4中的1。是简单假设。3.57复合假设composite hypothesis不完全确定总体分布的统计假设。例1:在正态分布N(,)的假定下,当标准差已知时,假设α一是简单假设,而当α未知时,则是复合假设。
例2:在3.55条的例中给出的前三个统计假设都是复合假设。3.58检验统计量test statistic取值决定一个统计假设被拒绝与否的统计量。3.59非参数检验non-parametric test当一个统计假设不能用有限个参数来描述时所采用的检验方法。例:检验一个样本是否来自某一分布的柯尔莫哥洛夫检验。3.60拒绝域rcjection region
检验统计量取值的一个集合,如果该统计量的观测值属于这个集合,则源假设被拒绝;否测.原假设不被拒绝,拒绝域也称为否定域。3.61 临界值i critical value
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。