数据分析期末试题及答案(2)

2018-11-19 22:16

由上图可以看出,该残差图中各点分布近似长条矩形,所以模型拟合较好,即该线性回归模型比较合理。

由上图可以看出,该残差图中各点分布近似长条矩形,所以模型拟合较好,即该线性回归模型比较合理。

误差项的正态性检验

数据(RES_1)标准化残差ZRES_1

由图可以看出,散点图近似的在一条直线附近,则可以认为数据来自正太分布总体

二、诊断发现运营不良的金融企业是审计核查的一项重要功能,审计核查的分类失败会导致灾难性的后果。下表列出了66家公司的部分运营财务比率,其中33家在2年后破产Y=0,另外33家在同期保持偿付能力(Y=1)。请用变量X1(未分配利润/总资产),X2(税前利润/总资产)和X3(销售额/总资产)拟合一个Logistic回归模型,并根据模型给出实际意义的分析,数据见财务比率.sav(25分)。 解:

整体性的假设检验 提出假设性检验

H0:回归系数?i=0(i=1,2,3),H1:不都为0 建立logistic模型:

p{Y?0}ln()=?0??1X1??2X2??3X3 1?p{Y?0} 分类表a,b 已预测 Y 步骤 0 已观测 Y 0 1 0 0 0 1 33 33 百分比校正 .0 100.0 总计百分比 a. 模型中包括常量。 b. 切割值为 .500 50.0 上表显示了logistic分析的初始阶段方程中只有常数项时的错判矩阵,其中33家在2年后破产(y=0),但模型均预测为错误,正确率为0%,另外33家在同期保持偿付能力(Y=1),正确率为100%,所以模型总的预测正确率为50%。 不在方程中的变量 步骤 0 变量 X1 X2 X3 总统计量 得分 31.621 19.358 2.809 37.623 df 1 1 1 3 Sig. .000 .000 .094 .000 由上表得知,如果变量X1(未分配利润/总资产),X2(税前利润/总资产)进入方程,概率p值都为0.000,小于显著性水平0.05,本应该是拒绝原假设,X1,X2是可以进入方程的。而X3(销售额/总资产)进入方程,概率p值为0.094,大于显著性水平0.05,本应该是接受原假设,X3(销售额/总资产)是不能进入方程的,但这里的解释变量的筛选策略为enter,是强行进入方程的。

用强行全部进入

模型汇总 步骤 1 -2 对数似然值 5.791 aCox & Snell R 方 .727 Nagelkerke R 方 .969 a. 因为参数估计的更改范围小于 .001,所以估计在迭代次数 13 处终止。 -2倍的对数似然函数值越小表示模型的拟合优度越高,这里的值是5.791,比较小,表示模型的拟合优度还可以,而且Nagelkerke R 方为0.969,与0相比还是比较大的,所以拟合度比较高

分类表 a 已观测 已预测 步骤 1 Y 0 1 总计百分比 a. 切割值为 .500 0 Y 1 32 1 1 32 百分比校正 97.0 97.0 97.0 上表显示了logistic分析的初始阶段方程中只有常数项时的错判矩阵,其中33家在2年后破产(y=0),但模型预测出了32家,正确率为97%,另外33家在同期保持偿付能力(Y=1),模型预测出了32家,正确率为97%,所以模型总的预测正确率为97%,较之前的有很大的提高。 方程中的变量 步骤 1 aB X1 X2 X3 常量 .336 .180 5.160 -10.334 S.E, .309 .107 5.200 11.147 Wals 1.178 2.852 .985 .859 df 1 1 1 1 Sig. .278 .091 .321 .354 Exp (B) 1.399 1.198 174.235 .000 a. 在步骤 1 中输入的变量: X1, X2, X3. 上表给出了方程中变量的系数。由表得出

?0??10.334,?1?0.336,?2?0.180,?3,?5.160以

?1为例,表示控制变量X2(税前利润/总资产)和X3(销售额/总资产)不变,X1(未分

p{Y?0})增加0.336分单位配利润/总资产)每增加一个单位,ln( 1?p{Y?0}模型方程:

p{Y?0}ln()=-10.334-0.336X1?0.180X2?4.160X3 1?p{Y?0}Logistic回归方程: P{Y=0}=

exp(-10.334-0.336X1?0.180X2?4.160X3)1?exp(-10.334-0.336X1?0.180X2?4.160X3)

由表得知,X1到X3对应的概率p值都大于0.05,接受原假设,表示X1到X3对Y都没有显著性影响。所以用下述方法改进。

用向前步进(wald)

模型汇总 步骤 1 2 -2 对数似然值 15.803 9.472 baCox & Snell R 方 .682 .711 Nagelkerke R 方 .910 .949 a. 因为参数估计的更改范围小于 .001,所以估计在迭代次数 9 处终止。 b. 因为参数估计的更改范围小于 .001,所以估计在迭代次数 10 处终止。 -2倍的对数似然函数值越小表示模型的拟合优度越高,这里的值是9.472,比之前的5.791要大,表示拟合优度降低,表示用向前的方法并没有比进入的方法好

分类表 a 已观测 Y 已预测 百分比校正


数据分析期末试题及答案(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:铸造车间安全操作规程

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: