管理统计实验上机报告
实验一
一、 实验目的
熟悉逐步回归法的基本思想及其原理,掌握处理过程,能够准确地分析其结果,并分析实际问题。
二、 实验原理 在考虑全部自变量中按其对的作用大小( 显著程度) 由大到小地逐个引入回归方程, 而对那些对作用不显著的变量可能始终不被引人回归方程。另外, 己被引人回归方程的变量在引入新变量后也可能失去重要性, 而需要从回归方程中剔除出去。引人一个变量或者从回归方程中剔除一个变量都称为逐步回归的一步, 每一步都要进行检验, 以保证在引人新变量前回归方程中只含有对影响显著的变量, 而不显著的变量已被剔除。
三、 实验过程及分析 1、读入数据“CH6CH9CH10证券投资与依据”,点击Analyze regression linear,系统弹出一个对话窗口,将\证券市场的投资总额\作为因变量,“证券市场外的收入”、“受教育程度”、“入市年份”、“股民年龄”作为解释变量,选择stepwise进行逐步线性回归。 2、点击OK,系统输出结果,如下列一系列的处理结果:
表一:Model Summary(e) Std. Adjusted Error of R Model 1 2 3 4 R .373(a) .417(b) .439(c) .455(d) Square .139 .174 .193 .207 R Square the R Square .139 .035 .019 .014 F 54.819 14.268 8.089 5.859 1 340 1 339 1 338 1 337 Sig. F .000 .000 .005 .016 1.778 Change Statistics Estimate Change Change df1 df2 Change Durbin-Watson .136 2.47018 .169 2.42335 .186 2.39841 .197 2.38135 a Predictors: (Constant), 证券市场以外年收入 b Predictors: (Constant), 证券市场以外年收入, 入市年份 c Predictors: (Constant), 证券市场以外年收入, 入市年份, 年龄
d Predictors: (Constant), 证券市场以外年收入, 入市年份, 年龄, 受教育程度 e Dependent Variable: 投入证券市场总资金
根据表中的第二列R Square的值的变化,可知x对于应变量的解释效果越来越好;对于Sig. F Change这一列,可知在加入了受教育程度这一变量后其F检验的显著性水平增加了0.016,大于0.01,即受教育程度对投资额的影响较小。对于Durbin-Watson,是检验这一数据是否存在序列相关问题,有结果可知其DW的检验值为1.778,接近于2,所以可以断定投资额这一应变量不存在序列相关性。
Model 1 2
Regression Residual Total Regression Residual
表二:ANOVA(e)
Sum of Squares
334.497 2074.614 2409.111 418.287 1990.824
df
1 340 341 2 339
Mean Square
334.497 6.102
209.144 5.873
F 54.819
35.613
Sig. .000(a)
.000(b)
3 4
Total Regression Residual Total Regression Residual Total
2409.111 464.816 1944.295 2409.111 498.043 1911.068 2409.111
341 3 338 341 4 337 341
154.939 5.752
124.511 5.671
26.935
21.956
.000(c)
.000(d)
a Predictors: (Constant), 证券市场以外年收入
b Predictors: (Constant), 证券市场以外年收入, 入市年份 c Predictors: (Constant), 证券市场以外年收入, 入市年份, 年龄
d Predictors: (Constant), 证券市场以外年收入, 入市年份, 年龄, 受教育程度 e Dependent Variable: 投入证券市场总资金
在表二中,给出了逐步回归过程中的4个模型。可以看出回归平方和(Sum of Squares列与每个模型的Regression行的交叉位置上的数据)随着逐步回归的过程,不断增大。也就是说,随着逐步回归模型的改进,已解释变差越来越大、从表中的最后一列,可以看出每个模型的F统计值的显著性概率都小于0.01,说明每个模型的总体回归效果都是显著的。受教育程度最后进入模型,说明这个变量对投资额的影响最小,与上面的分析相一致。
Model 1 2 3 4
(Constant)
证券市场以外年收入 (Constant)
证券市场以外年收入 入市年份 (Constant)
证券市场以外年收入 入市年份 年龄 (Constant)
证券市场以外收入x1 入市年份x2 年龄x3 受教育程度x4
表三:Coefficients(a)
Unstandardized Coefficients Standardized Coefficients
B 3.494 .377 4.493 .374 -.198 3.331 .383 -.166 .291 2.493 .371 -.180 .325 .273
Std. Error
.269 .051 .373 .050 .053 .551 .050 .053 .102 .647 .049 .053 .103 .113
Beta
.373 .370
t
Sig.
12.995 .000
7.404 .000 7.491 .000 12.031 .000 -.187 -3.777 .000
6.048 .000 .379 .143 .366 .159 .120
7.741 .000 2.844 .005 7.492 .000 3.170 .002 2.421 .016
-.156 -3.117 .002
3.852 .000 -.169 -3.380 .001
a Dependent Variable: 投入证券市场总资金
根据表三中所有模型的所有解释变量的t检验情况来看,几乎所有的变量的系数都在0.01的水平上,显著异于0。只有最后一个模型的“受教育程度”的显著性概率为0.016,大于0.01,但小于0.05,表明在0.05的显著性水平上,“受教育程度”的系数显著异于0。这些变量都可以作为解释变量存在于模型中,解释投资额的变化。
四、 实验总结
利用逐步线性回归分析,可以建立“最优”的回归方程以便对因变量进行解释或控制,而所谓“最优”回归方程, 主要是指希望在回归方程中包含所有对因变量影响显著的自变量而不包含对影响不显著的自变量的回归方程。
实验二
一、 实验目的
熟悉因子分析的基本思想与原理,熟悉用spss进行因子分析并掌握处理过程,能够准确地分析结果,并分析实际问题。 二、 实验原理
在变量之间都存在一些不能直接观测到的、但影响可观测变量变化的公共因子,因子分析法(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。因子模型如下:xk=ak1f1+ak2f2+?akmfm+ek,其中因子,它们之间是两两正交的;ei是特殊因子,只对相应的子的负载,相当于多元回归中的标准回归系数。 三、 实验过程及分析
因子分析常常有以下四个基本步骤:
(1)确认待分析的自变量是否适合作因子分析。 (2)构造因子变量。
(3)利用旋转方法使因子变量更具有可解释性。
(4)计算因子变量得分。
1、输入数据“CH11主成分企业创汇”,Analyze Data Reduction Factor,系统弹出选择变量与分析内容的主窗口。把创汇、利润、均汇、合同履约率作为因子分析的变量,从左框送入右边的Variables框中。
2、在根据弹出的对话框的提示,一步步选择了内容之后,点击OK,系统输出计算结果,见下表:
Correlation 创汇,百万美元 利润,百万美元 均汇,百万美元 出口合同履约率 表一:Correlation Matrix
创汇,百万美元 利润,百万美元 均汇,百万美元 1.000 .871 .570 .742 .871 1.000 .456 .736 .570 .456 1.000 .283 出口合同履约率 .742 .736 .283 1.000 fj是公共
xi起作用;aij是公共因
这是一相关系数表,从这一表中,可以看出在这四个自变量之间存在一定的相关关系,且他们的相关系数都比较的,因此可以初步猜测这些自变量之间存在部分公共因子,适合作因子分析。
表二:KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Sphericity
Test
of Approx. Chi-Square
df Sig.
.735 32.651
6 .000
这是KMO测度和巴特利特球体检验,该表结果显示:KMO值为0.735,按照KMO测度的显著性检验原则:越接近1越适合于作公共因子分析,该数据适宜作因子分析。表中的巴特
利特球体检验的显著性概率是0.000,小于0.01,说明数据具有相关性,是适宜作因子分析的,与表一的结果一致。
Initial Eigenvalues Component 1 2 3 4 Total 2.878 .753 .254 .115 % of Variance 71.940 18.831 6.354 2.874 Cumulative % 71.940 90.772 97.126 100.000 表三:Total Variance Explained
Rotation Sums of Squared Loadings Total 2.385 1.245 % of Variance 59.636 31.136 Cumulative % 59.636 90.772 Extraction Method: Principal Component Analysis.
在表三中,Initial Eigenvalues Total列,给出的是原始数据的相关系数矩阵R的特征根的值。% of Variance列,给出的是所占总体方差的比例。而Cumulative %表示的是所占方差的累积比例。有表中数据可知,前两个因子所占累积比例为90.772%,已超过一般所要求的85%,即所选的两个因子的特征根解释了总体方差的90.772%,可以这两个因子来反映原自变量的大部分信息。
表四:Rotated Component Matrix(a)
Component 创汇,百万美元 利润,百万美元 均汇,百万美元 出口合同履约率,% 1 .841 .880 .199 .929 2 .451 .320 .968 .045 表四中的数据显示的是旋转后的因子1与因子2的负载值表格,从表中可知:因子1对创汇、利润和履约率有较大影响,反映的是总业绩的情况,可以命名为“总业绩”因子。因子2对人均创汇影响大,反映的是与企业人均业绩的情况,故可命名为“人均业绩”。
表五:Component Score Covariance Matrix
Component 1 2 1 1.000 1.053E-16 2 1.053E-16 1.000 表五是两个因子的因子值协方差矩阵,它表明旋转后,两个因子仍然是正交的。
表六是因子值的系数矩阵,根据此表可用因子表示这四个变量如下:
创汇=0.297f1+0.149f2 利润=0.373f1-0.012f2 均汇=-0.286f1+0.983f2
出口合同履约率=0.515f1-0.335f2
.149 -.012 .983 -.335 表六:Component Score Coefficient Matrix Component 创汇,百万美元 利润,百万美元 均汇,百万美元 出口合同履约率,% 1 .297 .373 -.286 .515 2 四、 实验总结
因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。