GB/T 43389-2023
基本信息
标准号:
GB/T 43389-2023
中文名称:市场、民意和社会调查 数据分析方法
标准类别:国家标准(GB)
英文名称:Market,opinion and social research—Data analysis methods
标准状态:现行
发布日期:2023-11-27
实施日期:2023-11-27
出版语种:简体中文
下载格式:.pdf .zip
下载大小:1382250
相关标签:
市场
社会
方法
标准分类号
标准ICS号:社会学、 服务、公司(企业)的组织和管理、行政、运输>>公司(企业)的组织与管理>>03.100.20贸易、商业活动、市场营销
中标分类号:综合>>经济、文化>>A10商业、贸易、合同
关联标准
出版信息
出版社:中国标准出版社
页数:12页
标准价格:29.0
相关单位信息
起草人:许应成、华春翔、周晓群、朱盛艳、马振、张风格、冯卫、宁秀丽、张欣亮、周岭、赵位、张文平、廖源、许文倩、曹良克、吴倩、李莹、柳青、王双、陆小伟、藤君芳、范志平、邓铭庭、朱培武、蒙肇芸、郭新峰、杜英姿、常亮
起草单位:中国标准化研究院、宜宾学院、广州云检测科学研究院有限公司、四川省产品质量监督检验检测院、绍兴湖瑞纺织有限公司、西安正建工程咨询有限公司、泸州老窖股份有限公司、浙江省产品与工程标准化协会、吉林省格远市场调研咨询有限公司、山东及时雨建材科技有限公司等
归口单位:全国市场、民意和社会调查标准化技术委员会(SAC/TC 320)
提出单位:全国市场、民意和社会调查标准化技术委员会(SAC/TC 320)
发布部门:国家市场监督管理总局 国家标准化管理委员会
标准简介
本文件描述了市场、民意和社会调查中常见的数据分析方法,包括调查数据预处理及分析方法。
本文件适用于开展市场、民意和社会调查数据分析活动。
标准内容
ICS 03.100.20
CCS A 10
中华人民共和国国家标准
GB/T43389—2023
市场、民意和社会调查
数据分析方法
Market,opinion and social research-Data analysis methods2023-11-27发布
国家市场监督管理总局
国家标准化管理委员会
2023-11-27实施
GB/T43389—2023
规范性引用文件
术语和定义
调查数据预处理
-致性检查
缺失值处理
异常值诊断与处理
变量转换
量表转换
5调查数据的分析方法
描述统计分析
推论统计分析
应用示例
参考文献:
本文件按GB/T1.1一2020《标准化工作导则起草。
GB/T 43389—2023
第1部分:标准化文件的结构和起草规则》的规定请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由全国市场、民意和社会调查标准化技术委员会(SAC/TC320)提出并归口。本文件起草单位:中国标准化研究院、宜宾学院、广州云检测科学研究院有限公司、四川省产品质量监督检验检测院、绍兴湖瑞纺织有限公司、西安正建工程咨询有限公司、泸州老窖股份有限公司、浙江省产品与工程标准化协会、吉林省格远市场调研咨询有限公司、山东及时雨建材科技有限公司、广东省江门市质量技术监督标准与编码所、浙江省长三角标准技术研究院、中国计量大学、《中国城市报》社有限公司。
本文件主要起草人:许应成、华春翔、周晓群、朱盛艳、马振、张风格、冯卫、宁秀丽、张欣亮、周岭、赵位、张文平、廖源、许文倩、曹良克、吴倩、李莹、柳青、王双、陆小伟、藤君芳、范志平、邓铭庭、朱培武、蒙肇芸、郭新峰、杜英姿、常亮。1范围
市场、民意和社会调查
数据分析方法
GB/T43389—2023
本文件描述了市场、民意和社会调查中常见的数据分析方法,包括调查数据预处理及分析方法。本文件适用于开展市场、民意和社会调查数据分析活动。2
规范性引用文件
本文件没有规范性引用文件。
术语和定义
下列术语和定义适用于本文件。3.1
research
基于特定目的,按照一定规范收集、整理信息,进行分析和呈现的过程。注:research在实际应用中也称为“研究”或“调研”。相对survey而言research还包含了分析的过程。[来源:GB/T26315—2010,3.1]3.2
population
由所关注的全部个体组成的集合。[来源:GB/T26315—2010,5.2.1]3.3
sample
从总体中抽取的抽样单元构成的集合来源:GB/T26315—2010,5.2.6
statistic
统计量
由随机变量完全确定的函数。
[来源:GB/T3358.1—2009,1.8]3.5
样本中位数
sample median
有序样本中处于中间位置的数值注:如果样本数据量为偶数,则为中间两个数值的平均值[来源:GB/T3358.1—2009,1.13,有修改3.6
样本均值
平均数
sample mean
average
算术平均值
arithmeticmean
一组数据之和除以数据的总个数所得的值GB/T43389—2023
来源:GB/T3358.1一2009,1.15,有修改3.7
samplevariance
样本方差
组数据中每个数据值与该组数据的算术平均数之差的平方和除以样本数据的总个数减1所得的值。
[来源:GB/T3358.1—2009,1.16,有修改3.8
样本标准差
samplestandarddeviation
样本方差的非负平方根。
[来源:GB/T3358.1—2009,1.173.9
文frequency
给定类(组)中,特定事件发生的次数或观测值的个数。「来源:GB/T3358.1—2009,1.593.10
relativefrequency
用事件或者观测值发生的总数目除以频数所得的值。[来源:GB/T3358.1—2009,1.64,有修改]3.11
医probability
赋予事件闭区间[0,1]中的一个实数。[来源:GB/T3358.1—2009,2.5]3.12
定性数据
qualitative data
定性变量的观测结果。
注:可分为分类数据和定序数据。3.13
定量数据
quantitative data
定量变量的取值结果。
4调查数据预处理
调查数据预处理包括一致性检查、缺失值处理、异常值诊断与处理、变量转换和量表转换等4.2
一致性检查
主要包括变量的取值是否超出合理范围、有无逻辑错误及有无极端值4.3缺失值处理
缺失值处理方法包括但不限于以下几个方面a)删除缺失值:如果缺失值的比例较小且对整体数据影响不大,可以直接删除包含缺失值的样本或属性。
b)插补缺失值:如果缺失值的比例较大或对整体数据影响较大,可以使用插补方法填充缺失值。2
GB/T 43389—2023
常见的插补方法包括均值插补、中位数插补、众数插补、回归插补、随机插补等。使用特殊值填充:对于某些特定的缺失值,可以使用特殊值(如0或一1)进行填充,表示该值缺失。bzxZ.net
使用插值方法填充:对于时间序列数据或空间数据,可以使用插值方法(如线性插值、样条插d)
值、Kriging插值等)进行填充。使用机器学习算法预测填充:对于缺失值较多的情况,可使用机器学习算法(如随机森林、支持e)
向量机等)进行预测填充。
4.4异常值诊断与处理
般首先采用统计分布法、回归诊断法对异常值进行诊断,以及采用删除法、缩尾法、变换变量、降低异常值权数、插补法等处理异常值。4.5
5变量转换
根据数据分析的需要,在分析之前宜对现有的变量进行一定的修改或生成新的变量,可采用变量重新定义、变量转换、定类变量转换为0-1变量等方法。4.6量表转换
为保证数据的可比性,便于进行数据分析,某些场景下需要做一些量表的转换,可采用标准化变换、规格化变换等方法
5调查数据的分析方法
5.1概述
市场、民意和社会调查数据分析方法可分为描述统计分析和推论统计分析。5.2描述统计分析
将数据以表格、图形或数值形式表现出来,着重于对数量水平或其他特征的描述,可通过某具体指标反映某一方面的特征,也能通过若干变量描述它们的相互关系,其结果重在数量描述,但不具有推断性质。
3推论统计分析
通过样本推断总体,这类方法对数据的收集方法、变量的选择、测度的决定、资料的空间时间范围有严格的限制,宜符合严格的假设条件,其结果不仅可用于描述数量关系,还可以推断总体,进行预测、揭示原因以及检验理论等。
5.4应用示例
5.4.1概述
描述性统计分析适用于能收集到定量数据的几乎所有领域,它能为市场、民意和社会调查提供多方面的信息分析。推论统计分析使用样本数据来进行推断,并从中得出关于总体的结论,有助于在数据不够丰富的条件下为市场、民意和社会调查分析提供更多的支持。如表1所示。3
GB/T43389—2023
定性数据
定量数据
基本性质
表明对象或其类别的
表示对象的相对位置,
但不能表示差异大小
的数字
可以分类、排序、比较
对象间的差异
描述性统计分析示例
平均值
表1调查数据分析方法示例
应用案例
适用的分析方法
单变量统计方法
性别、品牌、商店等
偏好排序、在市场中的位
次、社会分层等
态度、年龄、收入、成本、
销售量、市场份额等
比例、众数等
比例、众数、中位数等
中位数、全距、均值等
多变量统计方法
二项式检验等
顺序相关系数、
弗里德曼检验、
方差分析等
相关系数、t检验、
方差分析、回归、
因子分析、结构方程、
结合分析等
计算数据集中数值的平均值,可用于了解数据的中心趋势。例如,计算一组学生的考试成绩平均分,以评估整体表现水平。
中位数
计算数据集中数值的中间值,可用于了解数据的中心位置。例如,计算一组员工的薪资中位数,以了解工资分布的中间水平。
:标准差
测量数据集中数值的离散程度,反映数据的变异程度。例如,在市场调研中,计算产品销售量的标准差可以评估销售数据的波动性。5.4.2.4频数分布表
将数据分组并计算每个组别中的观察频数,用于了解数据的分布情况。例如,制作一个年龄组别的频数分布表,以了解调查样本的年龄分布情况。5.4.2.5百分比
计算数据在总体中的百分比,用于描述某个类别在整体中的相对比例。例如,计算产品市场份额的百分比,以衡量产品在市场上的占有率。5.4.2.6全距
确定数据集中的最大和最小数值差值,以了解数据的范围。例如,计算某地区气温数据的最高和最低值差值,以描述气候的变化情况。5.4.2.7百分位数
计算数据集中特定百分比处的数值,可用于了解数据集的分位数分布。例如,计算一组学生的分数4
在75%百分位数处的值,以确定高分学生的水平。5.4.3推论统计分析示例
5.4.3.1配对t检验
GB/T 43389—2023
用于比较同一组观察值在不同条件下的均值差异是否显著。例如,通过配对t检验来评估某种治疗方法前后患者血压的变化
5.4.3.2非参数检验
用于比较数据集的分布或中位数等非参数统计量的差异是否显著。例如,使用非参数检验比较两组样本的中位数差异。
5.4.3.3多重比较
在进行多组比较时,采用修正方法来控制因多次比较而产生的错误率。例如,在进行多个广告渠道的效果比较时,使用多重比较方法进行比较。5.4.3.4方差分析的协变量
在进行方差分析时,考虑一个或多个协变量对因变量的影响。例如,在比较不同教育水平学生的成绩时控制年龄的影响。
5.4.3.5非线性回归
用于建立自变量和因变量之间的非线性关系模型。例如,使用非线性回归分析来拟合一组企业发展曲线数据,以了解企业的发展过程。5时间序列分析
用于分析时间序列数据的趋势、季节性和周期性等特征。例如,在金融领域,使用时间序列分析来预测股票价格的未来走势
5.4.3.7因子分析
用于探索观测变量之间的共同变异,并将其归纳为更少的潜在因子。例如,在市场研究中,使用因子分析来识别潜在的消费者行为维度GB/T43389—2023
GB/T 3358.1—2009
GB/T26315—2010
GB/T26316—2010
参考文献
统计学词汇及符号第1部分:一般统计术语与用于概率的术语市场、民意和社会调查
市场、民意和社会调查
服务要求
小提示:此标准内容仅展示完整标准里的部分截取内容,若需要完整标准请到上方自行免费下载完整标准文档。