表一:保险公司具有高等教育水平员工比例的基本描述统计量
单个样本统计量
受高等教育比例
N
19
均值 .7448
标准差 .16734
均值的标准误
.03839
表二:保险公司具有高等教育水平员工比例的单样本t检验结果 单个样本检验 检验值 = 0.8
t 受高等教育比例 -1.437 df 18 Sig.(双侧) .168 均值差值 -.05515 差分的 95% 置信区间 下限 -.1358 上限 .0255
结果分析:
由表一和表二可知,被调查的有效的19家保险公司中,具有高等教育水平员工比例的平均值为0.745,标准差为0.167;单样本t检验中t统计量的双尾概率P-值为0.168,比例总体均值的95%置信区间为(0.6642,0.8255)。如果显著性水平a为0.05,由于应进行单尾检验且0.168/2大于显著性水平a,因此不应拒绝原假设,不能认为保险公司具有高等教育水平员工比例的平均值不显著高于0.8。同时0.8大于95%的置信区间的下限值,也从另一角度证实了这个结论。
表三:保险公司年轻人比例的基本描述统计量
单个样本统计量
年轻人比例
N
26
均值 .7139
标准差 .15068
均值的标准误
.02955
表四:保险公司年轻人比例的单样本t检验结果 单个样本检验 检验值 = 0.5
t 年轻人比例 7.237 df 25 Sig.(双侧) .000 均值差值 .21388 差分的 95% 置信区间 下限 .1530 上限 .2747
结果分析:
由表三和表四可知,被调查的26家保险公司中,年轻人比例的平均值为0.714,标准差为0.151;单样本t检验中t统计量的双尾概率P-值接近于0,比例总体均值的95%置信区间为(0.6530,0.7747)。如果显著性水平a为0.05,由于概率P-值小于显著性水平a,因此应拒绝原假设,认为保险公司年轻人的比例与0.5存在显著差异,同时0.5不在相应的置信区间内,也证实了上述结论。
案例5-3 两个独立样本t检验的目的
表一:本地户口和外地户口家庭人均住房面积的基本描述统计量
组统计量
人均面积
户口状况 本市户口 外地户口
N 2825 168
均值 21.7258 26.7165
标准差 12.17539 18.96748
均值的标准误
.22907 1.46337
结果分析:由表一可以看出,本地户口和外地户口的家庭人均住房面积的样本平均值有一定差距。通过检验应推断这种差异是由抽样误差造成的还是系统性的。
表二:本地户口和外地户口家庭人均住房面积的两独立样本t检验结果
独立样本检验
人均面积
假设方差相等
65.469 .000 -4.968 2991 .000 -4.99069 1.00466
下限 上限
-6.96057 -3.02080
假设方差不相等
方差方程的 Levene 检验
F Sig.
均值方程的 t 检验
t df Sig.(双侧) 均值差值 标准误差值
差分的 95% 置信区间
-3.369 175.278
.001 -4.99069 1.48119 -7.91396 -2.06742
结果分析:
表二是本地户口和外地户口家庭人均住房面积的均值检验结果。分析结论应通过两步完成:第一步,两总体方差是否相等的F检验。这里,该检验的F统计量的观察值为65.469,对应的概率P-值为0.00。如果显著性水平a为0.05,由于概率P-值小于0.05,可以认为两总体的方差有显著差异。第二步,两总体均值的检验。在第一步中,由于两总体方差有显著差异,因此应看第三列t检验的结果。其中,t统计量的观测值为-3.369,对应的双尾概率P-值为0.001。如果显著性水平a为0.05,由于概率P-值小于0.05,可以认为两总体的均值有显著差异,即本地户口和外地户口的家庭人均住房面积的平均值存在显著差异。表二中的第七列和第八列分别为t统计量的分子和分母;第九列和第十列为两总体均值差的95%置信区间的上限和下限。由于该置信区间不跨零,因此也从另一个角度证实了上述推断。
案例5-4 两个独立样本t检验
Group Statistics 受高等教育比例 公司类别 全国性公司 外资和中外合资 N 8 10 Mean 0.6657 0.8257 Std. Deviation 0.16957 0.13178 Std. Error Mean 0.05995 0.04167 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Sig. Mean Std. Error Difference Lower Upper 受高等教育比例 Equal variances assumed Equal variances not assumed F Sig. t df (2-tailed) Difference Difference 0.912 0.354 -2.256 16 0.038 -0.16000 0.07091 -0.31033 -0.00968 -2.191 13.032 0.047 -0.16000 0.07301 -0.31770 -0.00231
结果分析:
上两个表的意义:全国性公司、外资和中外资公司中,外资和中外资合资公司具有高等教育水平的员工比例要高等全国性公司。表5-4(b)的分析结论应通过两步完成:1、两总体方差是否相等的f检验。这里,该检验的f统计量的观测值为0.912,对应的概率为p值为0.354。如果显著性水平a为0.05,由于概率p值大于0.05,可以认为两总体的方差无显著差异。2、两总体的均值的检验。在第一步中,由于两总体方差无显著差异,因此应看第二列t检验的结果。其中,t统计量的观测值为-2.256,对应的双尾概率p值为0.038.如果显著性水平a为0.05,由于概率p值小于0.05,可以认为两总体的均值存在显著差异,即全国性公司与外资和中外资合资公司中具有高等教育水平员工比列的均值存在显著差异。
案例5-5
Paired Samples Statistics Pair 1 喝茶前体重 喝后体重 Mean 89.2571 70.0286 N 35 35 Std. Deviation 5.33767 5.66457 Std. Error Mean .90223 .95749 Paired Samples Correlations Pair 1 喝茶前体重 & 喝后体重 N 35 Correlation -.052 Sig. .768 Paired Samples Test 1 Std. Paired Differences 95% Confidence Interval of Std. Error Mean the Difference Lower Upper t Sig. df (2-tailed) Mean Deviation Pair 喝茶前体重 - 喝后1.92286E1 体重 7.98191 1.34919 16.48669 21.97045 14.252 34 .000 结果分析:
具有显著的减肥效果上列表的意义:喝茶前与喝茶后样本的平均值有较大差异。喝茶后的平均体重低于喝茶前的平均体重。在显著水平a为0.05时,肥胖志愿者服用减肥茶前后的体重并没有明显的线性变化,喝茶前和喝茶后体重的线性相关程度较弱。如果显著性水平a为0.05,由于概率p值小于显著性水平0.05,应拒绝原假设,即认为总体上体重差的平均值与0有显著不同,意味着喝茶前和喝茶后的体重平均值存在显著差异,可以认为该减肥茶。
第五章 练习题1