数据分析期末试题及答案(2)

2018-11-19 22:16

由上图可以看出，该残差图中各点分布近似长条矩形，所以模型拟合较好，即该线性回归模型比较合理。

误差项的正态性检验

数据（RES_1）标准化残差ZRES_1

由图可以看出，散点图近似的在一条直线附近，则可以认为数据来自正太分布总体

二、诊断发现运营不良的金融企业是审计核查的一项重要功能，审计核查的分类失败会导致灾难性的后果。下表列出了66家公司的部分运营财务比率，其中33家在2年后破产Y=0，另外33家在同期保持偿付能力(Y=1)。请用变量X1(未分配利润/总资产)，X2(税前利润/总资产)和X3(销售额/总资产)拟合一个Logistic回归模型，并根据模型给出实际意义的分析，数据见财务比率.sav(25分)。解：

整体性的假设检验提出假设性检验

H0：回归系数?i=0（i=1，2,3），H1:不都为0 建立logistic模型：

p{Y?0}ln()=?0??1X1??2X2??3X3 1?p{Y?0} 分类表a,b 已预测 Y 步骤 0 已观测 Y 0 1 0 0 0 1 33 33 百分比校正 .0 100.0 总计百分比 a. 模型中包括常量。 b. 切割值为 .500 50.0 上表显示了logistic分析的初始阶段方程中只有常数项时的错判矩阵，其中33家在2年后破产（y=0），但模型均预测为错误，正确率为0%，另外33家在同期保持偿付能力(Y=1)，正确率为100%，所以模型总的预测正确率为50%。不在方程中的变量步骤 0 变量 X1 X2 X3 总统计量得分 31.621 19.358 2.809 37.623 df 1 1 1 3 Sig. .000 .000 .094 .000 由上表得知，如果变量X1(未分配利润/总资产)，X2(税前利润/总资产)进入方程，概率p值都为0.000，小于显著性水平0.05，本应该是拒绝原假设，X1，X2是可以进入方程的。而X3(销售额/总资产)进入方程，概率p值为0.094，大于显著性水平0.05，本应该是接受原假设，X3(销售额/总资产)是不能进入方程的，但这里的解释变量的筛选策略为enter，是强行进入方程的。

用强行全部进入

模型汇总步骤 1 -2 对数似然值 5.791 aCox & Snell R 方 .727 Nagelkerke R 方 .969 a. 因为参数估计的更改范围小于 .001，所以估计在迭代次数 13 处终止。 -2倍的对数似然函数值越小表示模型的拟合优度越高，这里的值是5.791，比较小，表示模型的拟合优度还可以，而且Nagelkerke R 方为0.969，与0相比还是比较大的，所以拟合度比较高

分类表 a 已观测已预测步骤 1 Y 0 1 总计百分比 a. 切割值为 .500 0 Y 1 32 1 1 32 百分比校正 97.0 97.0 97.0 上表显示了logistic分析的初始阶段方程中只有常数项时的错判矩阵，其中33家在2年后破产（y=0），但模型预测出了32家，正确率为97%，另外33家在同期保持偿付能力(Y=1)，模型预测出了32家，正确率为97%，所以模型总的预测正确率为97%，较之前的有很大的提高。方程中的变量步骤 1 aB X1 X2 X3 常量 .336 .180 5.160 -10.334 S.E, .309 .107 5.200 11.147 Wals 1.178 2.852 .985 .859 df 1 1 1 1 Sig. .278 .091 .321 .354 Exp (B) 1.399 1.198 174.235 .000 a. 在步骤 1 中输入的变量: X1, X2, X3. 上表给出了方程中变量的系数。由表得出

?0??10.334,?1?0.336,?2?0.180,?3,?5.160以

?1为例，表示控制变量X2(税前利润/总资产)和X3(销售额/总资产)不变，X1(未分

p{Y?0})增加0.336分单位配利润/总资产)每增加一个单位，ln( 1?p{Y?0}模型方程：

p{Y?0}ln()=-10.334-0.336X1?0.180X2?4.160X3 1?p{Y?0}Logistic回归方程： P{Y=0}=

exp(-10.334-0.336X1?0.180X2?4.160X3)1?exp(-10.334-0.336X1?0.180X2?4.160X3)

由表得知，X1到X3对应的概率p值都大于0.05，接受原假设，表示X1到X3对Y都没有显著性影响。所以用下述方法改进。

用向前步进（wald）

模型汇总步骤 1 2 -2 对数似然值 15.803 9.472 baCox & Snell R 方 .682 .711 Nagelkerke R 方 .910 .949 a. 因为参数估计的更改范围小于 .001，所以估计在迭代次数 9 处终止。 b. 因为参数估计的更改范围小于 .001，所以估计在迭代次数 10 处终止。 -2倍的对数似然函数值越小表示模型的拟合优度越高，这里的值是9.472，比之前的5.791要大，表示拟合优度降低，表示用向前的方法并没有比进入的方法好

分类表 a 已观测 Y 已预测百分比校正

共4页:

数据分析期末试题及答案(2).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档