京族 独龙族 裕固族 普米族 怒族 德昂族 基诺族 仫佬族 撒拉族 毛南族
26.43 37.79 28.93 28.99 42.62 30.37 25.61 23.51 28.2 25.83
6.73 13.41 9.36 6.34 13.31 9.11 7.49 7.51 9.07 7.14
107.16 161.59 123.01 128.41 192.55 130.44 98.3 120.26 121.3 117.3
396 176 360 290 312 332 376 308.9 186.3 220.3
32.61 61.38 41.23 61.09 63.12 72.88 50.12 33.17 71.93 29.13
102 6 1.4 32 25 46.5 35 92 143 81
22 19 3.7 12.6 16.9 19 20 20.3 807 20.3
3.59 3.8 6.67 2.89 3.11 1.7 2.42 3.12 3.18 3.76
资料来源:钱建明等,《中国少数民族健康趋势研究》,成都科学技术出版社,1999
4-4
在我国制定服装标准时,测量了3454名成年女子的14个部位的数据,得协方差矩阵如
下,是进行主成分分析。
x1
x2
x3
上体长 x1 手臂长 x2 胸围 颈围
x3 x4
7.033
x4
x5
x6
x7
x8 3.86
x9
x10
x11
x12
x13 x14
2.168 4.891
3.54 2.874 30.53
2.213 0.709 5.336 2.678 1.498 1.178 5.359 1.543
总肩宽 x5 前胸宽 x6 后背宽 x7 前腰节高 x8 后腰节高 x9 总体高 x10 身高 腰围 臀围
x11
下体长 x12
x14
1.681 1.267 4.638 1.254 3.107
1.6 4.028
1.276 1.161 5.864 1.538 1.851 2.614
2.718 1.765 5.713 1.512 1.74 1.479 1.197 5.241
2.827 1.799 4.432 1.282 1.659 1.246 1.239 4.123 4.818
9.358 8.043 6.514 2.814 4.115 3.094 2.814 6.572 6.572 29.66 8.889 7.511 6.639 2.533 3.745 3.745 2.994 2.875 6.045 25.747
24.4
5.154 5.68 3.855 1.589 2.643 2.643 2.324 2.002 3.658 18.659 16.822 5.993 5.213 2.939 19.53 4.974 4.069 4.692 4.692 4.525 4.247 10.336
x13 2.227 2.155 25.54 4.928 3.778 3.778 4.966 5.534 3.333 1.847 3.807 1.388 39.859
9.71 6.717 20.703 27.363
资料来源:张尧庭 方开泰著《多元统计分析方法》,科学出版社,1982,P115
第五章
5-1比较因子分析与主成分分析模型的关系,说明它们的相似之处和不同点。 5-2对练习4-1资料进行因子分析。
5-3从协方差矩阵出发,对例4-1资料进行因子分析,比较两者的结果。
5-4Holzinger KJ(1934)报告了355名小学生12项心理测试项目间的相关系数矩阵如下,
试作因子分析。
Perception of brightness count dots
straight and curved letters
speed in simple code verbal completion understanding paragraphs
reading vocabulary general information arithmetic proportions permutation-combinations
mechanical ability I mechanical ability II
1 0.690 0.596 0.515 0.421 0.350 0.376 0.405 0.342 0.325 0.260 0.165
1 0.655 0.557 0.397 0.300 0.349 0.448 0.381 0.377 0.385 0.200
1 0.600 0.386 0.252 0.329 0.351 0.284 0.324 0.255 0.146
1 0.255 0.200 0.258 0.310 0.241 0.286 0.252 0.145
1 0.611 0.642 0.660 0.407 0.359 0.321 0.162
1 0.611 0.642 0.660 0.407 0.370 0.236
1 0.738 0.435 0.392 0.408 0.303
1 0.478 0.385 0.379 0.285
1 0.460 0.406 0.278
1 0.384 0.213
1 0.398
1
资料来源:Harry H.Harman(1960).Modern Factor Analyses. The University of Chicago Press.398页。
第六章
6-1在例6.1中,就下列两种情况解释logistic回归模型中x的系数的涵义,并导出x的系数,写出相应的logistic 回归方程。
(1)暴露时x—O,非暴露时x一1; (2)暴露时x一1,非暴露时x- -1。
6-2某研究调查了169名妇女吸烟和使用口服避孕药对血栓形成的影响,资料如下,试进行分析。
病人类别
吸烟 不吸烟
合计
用避孕药 不用避孕药 用避孕药 不用避孕药
血栓 对照 14 2 7 22 12 8 25 84 58 111
6 -3为研究血压、胆固醇于心脏病的关系,调查了1339名冠心病和健康人的血压和胆固醇,结果如下。试建立logistic回归方程,并探讨自变量的适宜尺度。
冠心病 胆固醇(mg/1000ml) <200 200~219 220~260 >260 <200 200~219 220~260 >260
有
无
收缩压(mmHg) <127 127~146 147~166 2 3 3 3 2 0 8 11 6 7 12 11 117 121 47 85 98 43 119 209 68 67 99 46
>166
4 3 6 11 22 20 43 33
6-4下表列出了100个参加研究的个体之年龄(AGE),有无冠心病(CHD)的明显症状,表中ID为编号,AGEP为
年龄分组变量。结果变量是CHD,CHD=O表示个体无冠心病,CHD一1表示有冠心病。
(1)作CHD与AGE的散点图;
(2)对年龄分组变量AGRP分别统计冠心病人数,计算各年龄组冠心病的患病率P; (3)分别作P与AGRP,及logitP与AGRP的散点图,并与(1)的结果比较;
(4)分别建立CHD与AGE,及CHD与AGRP的logistic回归,并比较两个回归的结果; (5)建立P与AGRP的logistic曲线,并与(4)的结果比较。
100个个体的年龄和冠心病(CHD)状况
ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 CHD 0 0 0 0 1 0 0 0 0 0 0 0 0 0 AGE AGRP 20 1 23 1 24 1 25 1 25 1 26 1 26 1 28 1 28 1 29 2 30 2 30 2 30 2 30 2 ID 35 36 37 38 39 40 41 42 43 44 45 46 47 48 CHD 0 0 1 0 1 0 0 0 0 0 1 0 0 1 AGE AGRP ID CHD AGE AGRP 38 3 68 0 51 6 39 3 69 0 52 6 39 3 70 1 52 6 40 4 71 1 53 6 40 4 72 1 53 6 41 4 73 1 54 6 41 4 74 0 55 7 42 4 75 1 55 7 42 4 76 1 55 7 42 4 77 1 56 7 42 4 78 1 56 7 43 4 79 1 56 7 43 4 80 0 57 7 43 4 81 0 57 7
15 0 30 2 49 0 44 4 82 1 57 7 16 0 30 2 50 0 44 4 83 1 57 7 17 1 32 2 51 1 44 4 84 1 57 7 18 0 32 2 52 1 44 4 85 1 57 7 19 0 33 2 53 0 45 5 86 0 58 7 20 0 33 2 54 1 45 5 87 1 58 7 21 0 34 2 55 0 46 5 88 1 58 7 22 0 34 2 56 1 46 5 89 1 59 7 23 1 34 2 57 0 47 5 90 1 59 7 24 0 34 2 58 0 47 5 91 0 60 8 25 0 34 3 59 1 47 5 92 1 60 8 26 0 35 3 60 0 48 5 93 1 61 8 27 0 35 3 61 1 48 5 94 1 62 8 28 0 36 3 62 1 48 5 95 1 62 8 29 1 36 3 63 0 49 5 96 1 63 8 30 0 36 3 64 0 49 5 97 0 64 8 31 0 37 3 65 1 49 5 98 1 64 8 32 1 37 3 66 0 50 6 99 1 65 8 33 0 37 3 67 1 50 6 100 1 69 8 34 0 38 3
6-5为了解睾丸癌与隐睾症的关系.以及两者是否具有同侧性或异侧性倾向,在某地进行了病例一对照研究,结果如下:
结果分组 隐癌症 无 左侧 右侧 双侧
对照组 658 3 7 2 左侧睾丸癌 130 8 1 2 右侧睾丸癌
156
4 14
3
(l)根据上述结果拟合多类结果logistic回归模型
(2)根据拟合模型,检验睾丸癌与隐睾症是否有同侧性; (3)根据拟合模型,检验睾丸癌与隐睾症是否有异侧性;
(4)检验隐睾症与同侧睾丸癌的优势比是否与异侧隐睾症的优势比相同。 6 -6某医科大学外科在腿溃疡的治疗临床研究中,采用两种处理treat (Trental一1和Placebo—O),两种绷带(bandage 4 layer一1和Convatec -O),两种包扎方法(Granuflex一1和Na=0),治疗结果分为3各等级heal(无效一0,有效=1,痊愈一2)。 (1)根据上述结果拟合累积比数logistic回归模型; (2)拟合相邻比数logistic回归模型; (3)对(1)和(2)的结果进行比较;
treat bandage dressing heal Freq
treat bandage dressing heal 0 0 0 0 19 1 0 0 0 freq
21
0 0 0 1 4 1 0 0 1 0 0 0 2 2 1 0 0 2 0 0 1 0 21 1 0 1 0 0 0 1 1 3 1 0 1 1 0 0 1 2 2 1 0 1 2 0 1 0 0 9 1 1 0 0 0 1 0 1 8 1 1 0 1 0 1 0 2 6 1 1 0 2 0 1 1 0 10 1 1 1 0 0 1 1 1 10 1 1 1 1 0 1 1 2 5 1 1 1 2 (4)该资料是否符合建模的条件?
6-7 hosmer ,d.w.给出了1:3 配比的低出生体重危险因素研究,结果如下表。研究中按年龄配比,及年龄相同者配方,match 是配比组,obs是配比组中的患者编号,low表示低出生体重变量(low=1 ,体重出生低于2500g,否则low=0),lwt 表示母亲最后一次月经的体重,smoke 表示母亲吸烟状况(吸烟=1 不吸烟=0),ptl 表示早产史(有=1 无=0),表示高血压(有=1 无=0)ui表示子宫过敏危险情况(有=1 无=0)时对该资料进行分析。
obs low age lwt smoke ht ui ptl obs low age lwt smoke ht ui 1 1 16 130 0 0 0 0 3 0 22 112 1 0 0 2 0 16 112 0 0 0 0 4 0 22 169 0 0 0 3 0 16 135 1 0 0 0 1 1 23 97 0 0 1 4 0 16 95 0 0 0 0 2 0 23 130 0 0 0 1 1 17 130 1 0 1 1 3 0 23 119 0 0 0 2 0 17 103 0 0 0 0 4 0 23 123 0 0 0 3 0 17 122 1 0 0 0 1 1 23 110 1 0 0 4 0 17 113 0 0 0 0 2 0 23 128 0 0 0 1 1 17 120 0 0 0 0 3 0 23 190 0 0 0 2 0 17 113 0 0 0 0 4 0 23 110 0 0 0 3 0 17 119 0 0 0 0 1 1 24 132 0 1 0 4 0 17 119 0 0 0 0 2 0 24 115 0 0 0 1 1 18 148 0 0 0 0 3 0 24 115 0 0 0 2 0 18 100 1 0 0 0 4 0 24 110 0 0 0 3 0 18 90 1 0 1 0 1 1 24 138 0 0 0 4 0 18 229 0 0 0 0 2 0 24 90 1 0 0 1 1 18 110 1 0 0 1 3 0 24 133 0 0 0 2 0 18 107 1 0 1 0 4 0 24 116 0 0 0 3 0 18 100 1 0 0 0 1 1 25 85 0 0 1 4 0 18 90 1 0 1 0 2 0 25 118 1 0 0 1 1 19 91 1 0 1 1 3 0 25 125 0 0 0 2 4 10 5 10 5 10 8 12 7 7
ptl 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0