第3章
SPSS在咨询行业中的应用
3.1 研究背景及意义
居民消费水平是按国民收入或国内生产总值的使用总量中用于居民消费的总额除以年平均人口计算的,反映一个国家或一个地区居民的一般消费水平。居民消费水平是GDP中的一个重要组成部分,是拉动经济增长的三驾马车之一,一直是经济学家关注的焦点和研究的热门领域。
国家统计局的数据显示,2016年全国居民人均可支配收入23821元,比上年名义增长8.4%,扣除价格因素实际增长6.3%。居民人均可支配收入排名前十位的分别是上海(54305元)、北京(52530元)、浙江(38529元)、天津(34074元)、江苏(32070元)、广东(30296元)、福建(27608元)、辽宁(26040元)、山东(24685元)、内蒙古(24127元)。
2016全年全国居民人均消费支出17111元,比上年增长8.9%,扣除价格因素实际增长6.8%。在地方层面,居民人均消费支出排名前十位的分别是上海(37458元)、北京(35416元)、天津(26129元)、浙江(25527元)、广东(23448元)、江苏(22130元)、福建(20167元)、辽宁(19853元)、内蒙古(18072元)、重庆(16385元)。
居民消费支出是指核算期内由居民个人直接购买消费性货物和服务所花费的支出。从消费的性质来看,包括耐用消费品支出、非耐用消费品支出、各种文化生活服务费用支出。居民购买住房或建房用材料所花支出不应计入消费,计入消费的只是代表住房服务的房租支出。
居民消费支出包括以下4个部分:
(1)居民用货币直接购买的用于生活消费的各种货物,包括本期不能全部消费完的耐用消费品,如家具、家用电器等,也按购买全价计入本期消费中。
(2)居民用货币直接购买的用于生活消费的各种服务的支出,如房租、交通、洗理、教育、医疗保健、文化、日用品修理、家庭保姆等项支出。
(3)居民以实物工资形式获得的用于生活消费的各种货物和服务,包括免费或以低于市场价格获得的货物和服务。
(4)居民自产自用的计入核算期产出内的货物和自有住房的虚拟房租等。居民消费不包括作为生产投入和投资建房方面的支出。
3.2 数据建模思路
居民的消费水平在很大程度上受整体经济状况的影响。经济扩张时期,居民收入稳定,GDP也高,居民用于消费的支出较多,消费水平较高;反之,经济收缩时,收入下降,GDP也低,用于消费的支出较少,消费水平随之下降。
我国城镇家庭居民人均消费包括食品、衣着、居住、家庭设备、交通及通信、文教娱乐、医疗保健和其他8个指标。为了比较清楚地了解这8项指标对我国城镇居民人均消费总体的影响,以及消费动向,可以利用多配比样本的非参数检验中的傅莱德曼检验(Friedman)对各个指标进行检验。建模过程的流程图如图3-1所示。
图3-1 建模过程流程图
3.3 非参数检验
参数检验是在总体分布形式已知的情况下对总体分布的参数如均值、方差等进行推断的方法。在数据分析过程中,往往无法对总体分布形态做简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法,包括单样本的非参数检验、两独立样本的非参数检验、多独立样本的非参数检验、两配对样本的非参数检验和多配对样本的非参数检验。
3.3.1 单样本
SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括卡方检验、二项分布检验、K-S检验以及变量值随机性检验等方法。
(1)总体分布的卡方检验
例如,医学家在研究心脏病人猝死人数与日期的关系时发现:一周之中,星期一心脏病人猝死者较多,其他日子则基本相当,比例近似为2.8:1:1:1:1:1:1。现收集到心脏病人死亡日期的样本数据,推断其总体分布是否与上述理论分布相吻合。
卡方检验方法可以根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析。它的原假设是:样本来自的总体分布与期望分布或某一理论分布无差异。
(2)二项分布检验
在生活中有很多数据的取值是二值的,例如,人群可以分成男性和女性,产品可以分成合格和不合格,学生可以分成三好学生和非三好学生,投掷硬币实验的结果可以分成出现正面和出现反面等。通常将这样的二值分别用1或0表示。如果进行n次相同的实验,则出现两类(1或0)的次数可以用离散型随机变量X来描述。如果随机变量X为1的概率设为P,则随机变量X值为0的概率Q便等于1-P,形成二项分布。
SPSS的二项分布检验正是要通过样本数据检验样本来自的总体是否服从指定的概率为P的二项分布。其原假设是:样本来自的总体与指定的二项分布无显著差异。
从某产品中随机抽取23个样品进行检测并得到检测结果。用1表示一级品,用0表示非一级品。根据抽样结果验证该批产品的一级品率是否为90%。
(3)单样本K-S检验
K-S检验方法能够利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度的检验方法,适用于探索连续型随机变量的分布。
例如,收集周岁儿童身高的数据,需利用样本数据推断周岁儿童总体的身高是否服从正态分布。再例如,利用收集的住房状况调查的样本数据,分析家庭人均住房面积是否服从正态分布。
单样本K-S检验的原假设是:样本来自的总体与指定的理论分布无显著差异,SPSS的理论分布主要包括正态分布、均匀分布、指数分布和泊松分布等。
(4)变量值随机性检验
变量值随机性检验通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检验。
例如,在投硬币时,如果以1表示出现的是正面,以0表示出现的是反面,在进行了若干次投币后,将会得到一个以1、0组成的变量值序列。这时可能会分析“硬币出现正反面是否是随机的”这样的问题。
变量值随机性检验正是解决这类问题的一个有效方法。它的原假设是:总体变量值出现是随机的。
变量随机性检验的重要依据是游程。所谓游程,是指样本序列中连续出现相同的变量值的次数。可以直接理解,如果硬币的正反面出现是随机的,那么在数据序列中,许多个1或许多个0连续出现的可能性将不太大;同时,1和0频繁交叉出现的可能性也会较小。因此,游程数太大或太小都将表明变量值存在不随机的现象。
例台,为检验某耐压设备在某段时间内工作是否持续正常,测试并记录下该时间段内各个时间点上的设备耐压的数据。现采用游程检验方法对这批数据进行分析。如果耐压数据的变动是随机的,就可认为该设备工作一直正常,否则认为该设备有不能正常工作的现象。
3.3.2 两独立样本
两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。
SPSS中提供了多种两独立样本的非参数检验方法,其中包括曼-惠特尼U检验、K-S检验、W-W游程检验和极端反应检验等。
某工厂用甲、乙两种不同的工艺生产同一种产品。如果希望检验两种工艺下产品的使用是否存在显著差异,就可从两种工艺生产出的产品中随机抽样,得到各自的使用寿命数据。
甲工艺:675 682 692 679 669 661 693
乙工艺:662 649 672 663 650 651 646 652
(1)曼-惠特尼U检验
两独立样本的曼-惠特尼U检验可用于对两总体分布的比例判断。其原假设是:两组独立样本来自的两总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现判断。秩简单说就是变量值排序的名次,可以将数据按升序排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。
(2)K-S检验
K-S检验不仅能够检验单个总体是否服从某一理论分布,还能够检验两总体分布是否存在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。
这里是以变量值的秩作为分析对象,而非变量值本身。
(3)W-W游程检验
单样本游程检验用来检验变量值的出现是否随机,两独立变量的游程检验则是用来检验两独立样本来自的两总体的分布是否存在显著差异。其原假设是:两组独立样本来自的两总体分布无显著差异。
两独立样本的游程检验与单样本游程检验的思想基本相同,不同的是计算游程数的方法。两独立样本的游程检验中,游程数依赖于变量的秩。
(4)极端反应检验
极端反应检验从另一个角度检验两独立样本所来自的两总体分布是否存在显著差异。其原假设是:两独立样本来自的两总体的分布无显著差异。
基本思想是:将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端反应。如果实验样本没有出现极端反应,就认为两个总体分布无显著差异;相反,则认为存在显著差异。
3.3.3 多独立样本
多独立样本的非参数检验通过分析多组独立样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。多组独立样本是指按独立抽样方式获得的多组样本。
SPSS提供的多独立样本非参数检验的方法主要包括中位数检验、Kruskal-Wallis检验、Jonckheere-Terpstra检验。
例如,希望对北京、上海、成都、广州四个城市中一周岁儿童的身高进行比较分析,采用独立抽样方式获得四组独立样本。
(1)中位数检验
中位数检验通过对多组独立样本的分析,检验它们来自的总体的中位数是否存在显著差异。其原假设是:多个独立样本来自的多个总体的中位数无显著差异。
基本思想是:如果多个总体的中位数无显著差异,或者说多个总体有共同的中位数,那么这个共同的中位数应在各样本组中均处在中间位置上。于是,每组样本中大于该中位数或小于该中位数的样本数目应大致相同。
(2)Kruskal-Wallis检验
Kruskal-Wallis检验实质是两独立样本的曼-惠特尼U检验在多个样本下的推广,也用于检验多个总体的分布是否存在显著差异。其原假设是:多个独立样本来自的多个总体的分布无显著差异。
基本思想是:首先,将多组样本数据混合并按升序排列,求出各变量值的秩;然后,考察各组秩的均值是否存在显著差异。如果各组秩的均值不存在显著差异,则是多组数据充分混合,数值相差不大的结果,可以认为多个总体的分布无显著差异;反之,如果各组秩的均值存在显著差异,则是多组数据无法混合,某些组的数值普遍偏大,另一些组的数值普遍偏小的结果,可以认为多个总体的分布有显著差异。
(3)Jonckheere-Terpstra检验
Jonckheere-Terpstra检验也是用于检验多个独立样本来自的多个总体的分布是否存在显著差异的非参数检验方法,其原假设是:多个独立样本来自的多个总体的分布无显著差异。
基本思想与两独立样本的曼-惠特尼U检验类似,也是计算一组样本的观察值小于其他组样本的观察值的个数。
3.3.4 两配对样本
两配对样本的非参数检验是对总体分布不甚了解的情况下,通过对两组配对样本的分析,推断样本来自的两个总体的分布是否存在显著差异的方法。
SPSS提供的两配对样本非参数检验的方法主要包括McNemar检验、符号检验、Wilcoxon符号秩检验等。
例如,要检验一种新的训练方法是否对提高跳远运动员的成绩有显著效果,可以收集一批跳远运动员在使用新训练方法前后的跳远最好成绩,这样的两组样本便是配对的。再例如,分析不同广告形式是否对商品的销售产生显著影响,可以比较几种不同商品在不同广告形式下的销售额数据(其他条件保持基本稳定)。这里不同广告形式下的若干组商品销售额样本便是配对样本。可见,配对样本的样本数是相同的,且各样本值的先后次序是不能随意更改的。
(1)McNemar检验
McNemar检验是一种变化显著性检验,将研究对象自身作为对照者检验其“前后”的变化是否显著。其原假设是:两配对样本来自的两总体分布无显著差异。
分析学生在学习“统计学”课程前后对统计学重要性的认知程度是否发生了显著改变,可以随机收集一批学生在学习“统计学”之前以及学完以后认为统计学是否重要的样本数据(0表示“不重要”,1表示“重要”)。
应该看到,两配对样本的McNemar检验分析的变量是二值变量。因此,在实际应用中,如果变量不是二值变量,就应首先进行数据转换后再采用该方法,因而它在应用范围方面有一定的局限性。
(2)符号检验
符号检验也是用来检验两配对样本所来自的总体的分布是否存在显著差异的非参数方法。其原假设是,两配对样本来自的两总体分布无显著差异。
首先,分别用第二组样本的各个观察值减去第一组对应样本的观察值。差值为正则记为正号,差值为负则记为负号。然后,将正号的个数与负号的个数进行比较。如果正号个数和负号个数大致相当,则可以认为第二组样本大于第一组样本变量值的个数与第二组样本小于第一组样本的变量值个数是大致相当的,从总体上讲,这两组配对样本的数据分布差距较小;相反,如果正号个数和负号个数相差较多,则可以认为两个配对样本的数据分布差距较大。
应该看到,配对样本的符号检验注重对变化方向的分析,只考虑数据变化的性质,即变大了还是变小了,没有考虑变化幅度,即大了多少、小了多少,因而对数据利用是不充分的。
(3)Wilcoxon符号秩检验
Wilcoxon符号秩检验也是通过分析两配对样本,对样本来自的两总体的分布是否存在差异进行判断。其原假设是:两配对样本来自的两总体的分布无显著差异。
基本思想是:首先,按照符号检验的方法,分布用第二组样本的各个观察值减去第一组对应样本的观察值,差值为正则记为正号,为负则记为负号,并同时保存差值数据;然后,将差值变量按升序排列,并求出差值变量的秩;最后,分布计算正号秩总和W+和负号秩和W-。
3.3.5 多配对样本
多配对样本的非参数检验是通过分析多组配对样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。
例如,收集乘客对多家航空公司是否满意的数据,分析航空公司的服务水平是否存在显著差异。再例如,收集不同促销形式下若干种商品的销售额数据,分析比较不同促销形式的效果,再如,收集多名评委对同一批歌手比赛打分的数据,分析评委的打分标准是否一致,等等。
这些问题都可以通过多配对样本非参数检验方法进行分析。SPSS中的多配对样本的非参数检验方法主要包括Friedman检验、Cochran Q检验、Kendall协同系数检验等。
(1)Friedman检验
Friedman检验是利用秩实现对多个总体分布是否存在显著差异的非参数检验方法。其原假设是:多个配对样本来自的多个总体分布无显著差异。
SPSS将自动计算Friedman统计量和对应的概率P值。如果概率P值小于给定的显著性水平0.05,则拒绝原假设,认为各组样本的秩存在显著差异,多个配对样本来自的多个总体的分布有显著差异;反之,则不能拒绝原假设,可以认为各组样本的秩不存在显著性差异。
基于上述基本思路,多配对样本的Friedman检验时,首先以行为单位将数据按升序排列,并求得各变量值在各自行中的秩;然后分别计算各组样本下的秩总和与平均秩。多配对样本的Friedman检验适于对定距型数据的分析。
(2)Cochran Q检验
通过对多个配对样本的分析,推断样本来自的多个总体的分布是否存在显著差异。其原假设是:多个配对样本来自的多个总体的分布无显著差异。
Cochran Q检验适合对二值品质型数据的分析。例如,二分的评价:1代表满意,0代表不满意。
(3)Kendall协同系数检验
它也是一种对多配对样本进行检验的非参数检验方法,与第一种检验方法相结合,可方便地实现对评判者的评判标准是否一致的分析。其原假设是:评判者的评判标准不一致。
有6名歌手参加比赛,4名评委进行评判打分,现在需要根据数据推断这4个评委的评判标准是否一致。
如果将每个被评判者对象的分数看作来自多个总体的配对样本,那么该问题就能转化为多配对样本的非参数检验问题,仍可采用Friedman检验,于是相应的原假设便转化为:多个配对样本来自的多个总体的分布无显著差异。但对该问题的分析是需要继续延伸的,并非站在对6名歌手的演唱水平是否存在显著差异的角度进行分析,而是在认定他们存在差异的前提下继续判断4个评委的打分标准是否一致。
如果利用Friedman检验出各总体的分布不存在显著差异,即各个歌手的秩不存在显著差异,则意味着评委的打分存在随意性,评分标准不一致。原因在于:如果各个评委的评判标准是一致的,那么对于某个歌手来说将获得一致的分数,也就是说,评委给出的若干个评分的秩应完全相同,这就必然会导致各歌手评分的秩有较大的差异。
3.4 模型数据处理
影响城镇居民人均消费的因素主要有食物消费、衣物消费、居住消费、家居设备、交通通信、医疗保健、文教娱乐和其他消费。
本文建模数据来源于《2016年中国统计年鉴》,整理好以上8个指标的2015年各省市数据后,导入SPSS 24.0软件,数据视图如图3-2所示。
图3-2 数据视图
在变量视图页面设置变量的类型、宽度、小数位数、标签、值和角色等,如图3-3所示。
图3-3 变量视图
为Area_type字段添加值标签,其中1是华北、2是东北、3是华东、4是华中、5是华南、6是西南、7是西北,如图3-4所示。
图3-4 所属区域值标签
3.5 SPSS操作步骤——非参数检验
由于食物消费、衣物消费、居住消费、家居设备、交通通信、医疗保健、文教娱乐和其他消费8个变量之间是相互影响的,因此我们使用多配对样本的非参数检验方法。
操作步骤:
在数据视图窗口下,选择“分析>非参数检验>旧对话框K个相关样本”菜单项,如图3-5所示。
图3-5 K个相关样本
在“针对多个相关样本的检验”对话框中,把参与分析的变量选到“检验变量”框中,如图3-6所示。
有三种检验可用于比较多个相关变量的分布:
- 傅莱德曼(Friedman)检验是以下两项的非参数等同检验:单样本重复测量设计,或者每个单元格一个观察值的二阶方差分析。Friedman检验k个相关变量来自同一总体的原假设。检验统计基于k个变量的等级从1到k。
- 肯德尔(Kendall)W是Friedman统计的标准化形式。Kendall W可解释为协调系数,是评分者之间一致程度的测量。每个个案是一名评分者,每个变量是被裁判的一项。Kendall W的范围从0(完全不一致)到1(完全一致)。
- 柯克兰(Cochrans)Q等于Friedman检验,但它适用于所有响应都是二元响应的情况。该检验是McNemar检验对k样本情况的扩展。Cochrans Q检验多个相关二分变量具有相同平均值的假设。
图3-6 针对多个相关样本的检验
3.5.1 “精确”选项
单击“针对多个相关样本的检验”对话框中的“精确”按钮,打开“精确检验”界面(见图3-7),其中包含以下三种方法。
- 仅渐进法:基于渐进分布的显著性水平的检验指标,适于大样本,如果样本过小或者分布不好,就会影响检验的效力。
- 蒙特卡洛法:适用于精确显著性水平的无偏估计,如果样本过大,数据处理过程太长,就应该使用这个选项,需要设置置信度级别和样本数。
- 精确:可以设定数据处理的时间,如果数据处理时间超过了你设定的时间,就应该使用蒙特卡洛法,需要每个检验的时间限制为多少分钟。
图3-7 “精确检验”设置
3.5.2 “统计”选项
单击“针对多个相关样本的检验”对话框中的“统计”按钮,打开“统计”选择卡,其中主要包括以征两项。
- 描述性:显示平均值、标准差、最小值、最大值和非缺失个案数。
- 四分位数:显示对应于第25个、第50个和第75个百分位数的值。
图3-8 “统计”设置
这里勾选“描述”和“四分位数”,再单击“继续”按钮,如图3-8所示。
3.6 SPSS结果介绍
(1)描述性统计
使用多配对样本的非参数检验方法,对食物消费、衣物消费、居住消费、家居设备、交通通信、医疗保健、文教娱乐和其他消费进行分析,描述性统计结果如图3-9所示。
描述统计可知,8个指标的记录数均为31个;食物消费的平均值最大,其他消费的平均值最小;居住消费的标准差最大,其他消费的标准差最小。
图3-9 描述统计
(2)变量的秩
傅莱德曼(Friedman)检验的结果如图3-10所示。食物消费对人均消费的影响最大,其次是居住消费,而影响最小的是其他消费。
(3)检验统计
检验结果中,卡方值为206.624,渐近显著性为0.000,小于给定水平0.05,故拒绝原假设,认为8个指标对我国城镇居民人均消费的影响是有显著差异的,如图3-11所示。
图3-10 变量秩平均值
图3-11 统计检验结果
3.7 居民消费建议
从长期分析,要刺激城镇消费市场,就必须依靠增加城镇居民的人均可支配收入。对于刺激消费的一些短期性政策,如降低利率、增加消费信贷等,虽然短期内可能扩大消费,但不可能影响消费和收入的长期均衡关系,上一期扩大的消费将在下一期的消费中进行修正。因此,短期的消费政策是无效的。可见要提高居民消费水平,首先要在提高居民可支配收入上做文章。具体措施应包括以下三个方面。
(1)提高职工工资水平
适当提高单位职工工资水平,进一步完善工资政策。目前,城市居民收入,从显性收入方面的工资到隐性收入方面的社会福利,乃至就业机会本身,都存在着向下的压力。这一现象说明,作为价格体系的重要组成部分的劳动者收入必然会影响总体价格水平的变动趋势。因此,应该从制定和实施有利于提高城市居民整体收入水平的方面入手,争取取得更好的效果。
(2)健全社会保障制度
完善下岗职工基本生活保障、失业保险和城市居民最低生活保障“三条保障线”制度,积极推进城镇职工医疗保险制度改革,全面普及城市居民最低生活保障制度,提高低收入者的福利保障程度,建立对低收入群体的社会救济法律法规制度。在做到“应保尽保”基础上,保障金应随着市场价格、居民收入、消费水平的变化进行适当调整和增加,消除低收入居民家庭对当前和今后生活的担心和顾虑,增强他们对未来的信心。
(3)强化税收调节功能
要继续强化税收调节个人收入分配的功能。完善个人所得税体制,加快建立分类与综合相结合的个人所得税体制,进一步强化税收征缴,适当扩大消费税的征收范围,特别应该对奢侈品征收较高的消费税。