定型数据分析习题答案(7)

2019-09-01 11:36

|U|?|??b(?)|?|?0.316|?|?3.610|?3.610?1.96,

?b(?)故在水平??0.05下拒绝H0,即对于老年人,性别与饮料偏好有相合关系。

注1:由于对于年轻人,性别与饮料偏好有正相合关系,即年轻女性比年轻男性更喜欢饮料B。而对于老年人,性别与饮料偏好有负相合关系,即老年女性比老年男性更喜欢饮料A。一正一负,数据合并后没有显著相合性了。 注2:记号与称呼上,要能区分U检验统计量与?2检验统计量:

U~N(0,1)??2??U2~?2(1)

注3:p值的概念要清楚,要能正确地表示与计算p值: 首先要明确检验分布与拒绝域的形式; 然后计算出检验统计量的观察值;

最后,以检验统计量的值为临界值定出拒绝域,计算检验分布在此区域的概率。

2??()例如本题中,采用检验统计量,则

?b(?)2检验分布为?2(1),拒绝域形式为{??c};

?222??()?(?3.610)?13.0321; 算出检验统计量的观察值

?b(?)2?}?{?考虑拒绝域形式为:{???统计量的观察值基于检验分布?2(1),计算p值:

222?13.0321};

p值?P{?2(1)?13.0321}?0.000004?0.05

2注4:记号上注意区分卡方分布?2(1)与分卡方分布的分位数?0.95(1)。

(P161Ex7)

分析:联系教材例5.6,例5.7。比较“分开来看”与“合起来看”的结果是否一致。倘若不一致,则是有偏比较。

解:

将外销与内销产品合起来看不合格品率: 车间主任 产品总数 不合格品总数 不合格品率 王 0.078431 2703 212 张 0.143493 1798 258 李 0.115538 753 87 王的车间的产品不合格品率最低,其次是李的车间,最高的是张的车间。 再分内销产品与外销产品分别看不合格品率。 从内销产品看不合格品率: 车间主任 产品总数 不合格品总数 不合格品率 王 0.055321 2368 131 张 0.010239 293 3 李 0.039088 307 12 王的车间的产品不合格品率最高,其次是李的车间,最低的是张的车间。 从外销产品看不合格品率: 车间主任 产品总数 不合格品总数 不合格品率 王 0.658537 123 81 张 0.204491 1247 255 李 0.208914 359 75 王的车间的产品不合格品率最高,其次是李的车间,最低的是张的车间。

综上,“分开来看”与“合起来看”的结果不一致,因此是有偏比较。

有偏的原因是各车间的内销与外销的比重不一致,而且总体上内销产品的不合格品率低于外销产品的不合格品率。无论内销产品还是外销产品,王的车间产品不合格品率都是最高的,但由于产品大多是内销产品,所以总的不合格品率却是最低的。因此产品类型(内销还是外销)是产生偏差的原因,是混杂因素。

(P183Ex1)

分析:将年龄与体质指数都作为定量变量,用SPSS建立Logistic线性回归模型。

解:要建立Logistic线性回归模型

lnp??0??1AGE??2BMI 1?p(1)将原来的三维列联表拉直,建立含四个变量的数据集,四个变量分别为年龄,体质指数,是否患心血管病,人数。 (2)将数据集导入SPSS;

(3)数据==》加权个案==》将人数设置为频数;

(4)分析==》回归==》二元Logistic,用二元Logistic过程建立Logistic线性回归模型,将是否患心血管病设置为因变量,将年龄和体质指数设置为协变量,其他采用默认方式,点选确定,输出模型拟合结果: 方程中的变量 步骤 1 a 年龄 体质指数 常量 B .054 .238 -8.293 S.E, .010 .082 2.234 Wals 26.420 8.470 13.777 df 1 1 1 Sig. .000 .004 .000 Exp (B) 1.055 1.269 .000 a. 在步骤 1 中输入的变量: 年龄, 体质指数. 即拟合的Logistic线性回归方程为

lnp??8.293?0.054AGE?0.238BMI 1?p由系数都为正可知:年龄越大越容易患心血管病,体质指数越大也越容易患心

血管病。

(P184Ex2)

分析:将年龄(A)作为定量变量,婚姻状况作为定性名义变量,包含3个哑变量(M1, M2, M3),以及3个与年龄的交互作用变量(AM1, AM2, AM3),用SPSS建立Logistic线性回归模型。

解:要建立Logistic线性回归模型

lnp??0??A??1M1??2M2??3M3??1AM1??2AM2??3AM3 1?p

SPSS输出模型拟合结果为: 方程中的变量 年龄 婚姻状况 婚姻状况(1) 婚姻状况(2) 婚姻状况(3) 婚姻状况 * 年龄 婚姻状况(1) by 年龄 婚姻状况(2) by 年龄 婚姻状况(3) by 年龄 常量 B .098 1.195 -1.615 -5.630 -.009 .023 .085 -10.267 S.E, .003 .223 .215 .256 .004 .003 .004 Wals 897.960 2450.346 28.790 56.445 485.038 1642.167 7.141 48.374 495.590 df 1 3 1 1 1 3 1 1 1 1 Sig. .000 .000 .000 .000 .000 .000 .008 .000 .000 .000 Exp (B) 1.103 3.305 .199 .004 .991 1.023 1.089 .000 .213 2334.341 a. 在步骤 1 中输入的变量: 年龄, 婚姻状况, 婚姻状况 * 年龄 . 即拟合的Logistic线性回归方程为

lnp??10.267?0.98A?1.195M1?1.615M2?5.63M3?0.009AM1?0.023AM2?0.085AM31?p并且方程是显著的。由此可以得到婚姻状况下死亡率和年龄的Logistic线性回归方程为 未婚状况:lnp??10.267?0.98A?1.195?0.009A??9.072?0.971A 1?pp??10.267?0.98A?1.615?0.023A??11.882?1.003A 1?p有配偶状况:ln丧偶状况:lnp??10.267?0.98A?5.63?0.085A??15.897?1.065A 1?pp??10.267?0.98A 1?p离婚状况:ln由系数的正负和大小可知:年龄越大死亡率越高;相同年龄下,丧偶状况的死亡率最低,其次是有配偶状况,然后是离婚状况,死亡率最高的是未婚状况。

注:这分析结果有点很奇怪。进一步观察拟合检验与残差,可以发现上述模型拟合得并不好。应该考虑设法构造更合适的模型。

(P184Ex3)

分析:将年龄(A)作为定量变量,文化程度(E)作为定性有序变量,包含文化程度与年龄的交互作用变量(AE),用SPSS建立Logistic线性回归模型。

解:要建立Logistic线性回归模型

lnp??0??A??E??AE 1?p方程中的变量 SPSS输出模型拟合结果为: 步骤 1 a 年龄 文化程度 年龄 by 文化程度 常量 B .136 .457 -.010 -12.478 S.E, .001 .023 .000 .050 Wals 35343.708 383.494 711.334 63383.169 df 1 1 1 1 Sig. .000 .000 .000 .000 Exp (B) 1.145 1.579 .991 .000 a. 在步骤 1 中输入的变量: 年龄, 文化程度, 年龄 * 文化程度 . 即拟合的Logistic线性回归方程为

lnp??12.478?0.136A?0.457E?0.010AE 1?p并且方程是显著的。由系数的正负和大小可知:年龄越大死亡率越高;文化程度越高死亡率越高;相同年龄下,文化程度越高死亡率越低。

注:这分析结果有点很奇怪。进一步观察拟合检验与残差,可以发现上述模型拟合得并不好。应该考虑构造更合适的拟合模型。

(P184Ex4)

分析:企业作为定性名义变量,包含1个哑变量(F),胆固醇(C, cholesterol)和收缩压 (P,Systolic pressure)作为定量变量,用SPSS建立Logistic线性回归模型。

解:要建立Logistic线性回归模型

lnp??0??1F??2C??3P 1?p方程中的变量 SPSS输出模型拟合结果为: 步骤 1 a 胆固醇 收缩压 企业 常量 B .502 .430 -.178 -4.718 S.E, .073 .080 .242 .536 Wals 47.645 28.660 .539 77.435 df 1 1 1 1 Sig. .000 .000 .463 .000 Exp (B) 1.652 1.538 .837 .009 a. 在步骤 1 中输入的变量: 胆固醇, 收缩压, 企业. 即拟合的Logistic线性回归方程为

lnp??4.718?0.178F?0.502C?0.430P 1?p???0.178但标准误是0.242 若?1?0则说明工厂不同对职工患冠心病没有影响。而现在?1p值=0.463,比较大,说明不能拒绝假设H0:?1?0,因此认为工厂不同对职工患冠

心病没有影响。企业A1的抱怨没有道理。

注:观察拟合检验与残差,可以发现模型的总体拟合效果还可以,但在胆固醇的低水平上上述模型拟合得并不好。可以考虑构造更合适的拟合模型。


定型数据分析习题答案(7).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:致用英语4 unit2

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: