应用数理统计习题(3)

2019-09-01 15:16

析并比较两种分类准则的优良性,哪一个较优?

(6)对变量组?X1,X3?T,?X1,X4?重复(1)~(4)的分析,你发现哪个变量组的分类效

T果较好?

(7)利用所有四个变量,重复(1)~(4)的分析,结果如何?是否用较多的变量建立的判别准则的分类效果一定优于用其中一部分变量所建立的判别准则的分类效果。

2.8 E.Anderson在1939年收集了 尾属植物中的三个品种的花的形状尺寸。从这三个品

种(记为G1,G2,G3)中各选择了50株植物,测量了下述四个变量:

X1?花的萼片长度,X3?花瓣的长度,XX42?花的萼片宽度?花瓣的宽度

数据如下表

(1)只考虑变量?X2,X4?,假设三个总体对这两个均服从二维正态分布,在协方差

T矩阵不等的假定下,构造二次判别函数(3.3.23),并评估相应的判别准则(3.3.24)分类效果。

(2) 假定有新样品x0??x2,x4???3.5,1.75?,利用(1)中的判别准则对x0分类。

TT(3) 假定三个总体的协方差矩阵相等,求线性判别函数(3.3.25),并评估相应的判

别准则(3.3.26)分类效果和(1)中的结果作比较。 (4) 利用(3)中的判别准则判别新样品x0??x2,x4???3.5,1.75?的归类,它和

TT(2)中的结果是否相同?

(5) 利用全部四个变量重复(1)和(3)的分析,并和(1),(3)中的结果作比较,

评述你的发现。

G1 x1 x2 x3 G2 x4 x1 x2 x3 G3 x4 x1 x2 x3 x4 5.1 4.9 4.7 4.6 5.0 5.4 4.6 5.0 4.4 4.9 5.4 4.8 4.8 4.3

3.5 3.0 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 3.7 3.4 3.0 3.0 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 1.5 1.6 1.4 1.1 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 0.2 0.2 0.1 0.1 7.0 6.4 6.9 5.5 6.5 5.7 6.3 4.9 6.6 5.2 5.0 5.9 6.0 6.1 3.2 3.2 3.1 2.3 2.8 2.8 3.3 2.4 2.9 2.7 2.0 3.0 2.2 2.9 4.7 4.5 4.9 4.0 4.6 4.5 4.7 3.3 4.6 3.9 3.5 4.2 4.0 4.7 1.4 1.5 1.5 1.3 1.5 1.3 1.6 1.0 1.3 1.4 1.0 1.5 1.0 1.4 6.3 5.8 7.1 6.3 6.5 7.6 4.9 7.3 6.7 7.2 6.5 6.4 6.8 5.7 3.3 2.7 3.0 2.9 3.0 3.0 2.5 2.9 2.5 3.6 3.2 2.7 3.0 2.5 6.0 5.1 5.9 5.6 5.8 6.6 4.5 6.3 5.8 6.1 5.1 5.3 5.5 5.0 2.5 1.9 2.1 1.8 2.2 2.1 1.7 1.8 1.8 2.5 2.0 1.9 2.1 2.0

5.8 5.7 5.4 5.1 5.7 5.1 5.4 5.1 4.6 5.1 4.8 5.0 5.0 5.2 5.2 4.7 4.8 5.4 5.2 5.5 4.9 5.0 5.5 4.9 4.4 5.1 5.0 4.5 4.4 5.0 5.1 4.8 5.1 4.6 5.3 5.0 4.0 4.4 3.9 3.5 3.8 3.8 3.4 3.7 3.6 3.3 3.4 3.0 3.4 3.5 3.4 3.2 3.1 3.4 4.1 4.2 3.1 3.2 3.5 3.6 3.0 3.4 3.5 2.3 3.2 3.5 3.8 3.0 3.8 3.2 3.7 3.3 1.2 1.5 1.3 1.4 1.7 1.5 1.7 1.5 1.0 1.7 1.9 1.6 1.6 1.5 1.4 1.6 1.6 1.5 1.5 1.4 1.5 1.2 1.3 1.4 1.3 1.5 1.3 1.3 1.3 1.6 1.9 1.4 1.6 1.4 1.5 1.4 0.2 0.4 0.4 0.3 0.3 0.3 0.2 0.4 0.2 0.5 0.2 0.2 0.4 0.2 0.2 0.2 0.2 0.4 0.1 0.2 0.2 0.2 0.2 0.1 0.2 0.2 0.3 0.3 0.2 0.6 0.4 0.3 0.2 0.2 0.2 0.2 5.6 6.7 5.6 5.8 6.2 5.6 5.9 6.1 6.3 6.1 6.4 6.6 6.8 6.7 6.0 5.7 5.5 5.5 5.8 6.0 5.4 6.0 6.7 6.3 5.6 5.5 5.5 6.1 5.8 5.0 5.6 5.7 5.7 6.2 5.1 5.7 2.9 3.1 3.0 2.7 2.2 2.5 3.2 2.8 2.5 2.8 2.9 3.0 2.8 3.0 2.9 2.6 2.4 2.4 2.7 2.7 3.0 2.7 3.1 2.3 3.0 2.5 2.6 3.0 2.6 2.3 2.7 3.0 2.9 2.9 2.5 2.8 3.6 4.4 4.5 4.1 4.5 3.9 4.8 4.0 4.9 4.7 4.3 4.4 4.8 5.0 4.5 3.5 3.8 3.7 3.9 5.1 4.5 5.1 4.7 4.4 4.1 4.0 4.4 4.6 4.0 3.3 4.2 4.2 4.2 4.3 3.0 4.1 1.3 1.4 1.5 1.0 1.5 1.1 1.8 1.3 1.5 1.2 1.3 1.4 1.4 1.7 1.5 1.0 1.1 1.0 1.2 1.6 1.5 1.6 1.5 1.3 1.3 1.3 1.2 1.4 1.2 1.0 1.3 1.2 1.3 1.3 1.1 1.3 5.8 6.4 6.5 7.7 7.7 6.0 6.9 5.6 7.7 6.3 6.7 7.2 6.2 6.1 6.4 7.2 7.4 7.9 6.4 6.3 6.1 6.3 6.3 6.4 6.0 6.9 6.7 6.9 5.8 6.8 6.7 6.7 6.3 6.5 6.2 5.9 2.8 3.2 3.0 3.8 2.6 2.2 3.2 2.8 2.8 2.7 3.3 3.2 2.8 3.0 2.8 3.0 2.3 3.8 2.8 2.8 2.6 2.8 3.4 3.1 3.0 3.1 3.1 3.1 2.7 3.2 3.3 3.0 2.5 3.0 3.4 3.0 5.1 5.3 5.5 6.7 6.9 5.0 5.7 4.9 6.7 4.9 5.7 6.0 4.8 4.9 5.6 5.8 6.1 6.4 5.6 5.1 5.6 5.1 5.6 5.5 4.8 5.4 5.6 5.1 5.1 5.9 5.7 5.2 5.0 5.2 5.4 5.1 2.4 2.3 1.8 2.2 2.3 1.5 2.3 2.0 2.0 1.8 2.1 1.8 1.8 1.8 2.1 1.6 1.9 2.0 2.2 1.5 1.4 1.5 2.1 1.8 1.8 2.1 2.4 2.3 1.9 2.3 2.5 2.3 1.9 2.0 2.3 1.8

第四章 聚类分析

4.1考虑下列4个样品的距离矩阵

12341?0???210? D??3?1120???4?5340?(1) 用最短距离法、最长距离法和类平均法对这4个样品聚类,画出聚类谱系图。 (2) 将D转化为模糊矩阵,利用模糊聚类法作聚类分析,画出谱系图。 (3) 比较各方法的聚类结果,指出它们之间的异同

4.2设有5个变量X1,X2,X3,X4和X5,它们之间的相关系数矩阵为

X1X1?1?X20.643?R?X3??0.082?X4?0.045X5???0.013X21?0.0860.211?0.3281?0.1640.4861?0.185X3X4X5??? ???1??

以R作为各变量间的相似性度量,利用最短距离法、最长距离法及类平均法对这5个变量作聚类分析,画出谱系图并比较这些结果。若利用模糊聚类法,情况又如何?

4.3根据第二章习题8中关于55个国家和地区1984年前在7个竞赛项目上的女子纪录数据作聚类分析:

(1)利用欧式距离计算各国家和地区间在这7个项目上的距离矩阵。

(2)利用最短距离法、最长距离法和类平均法对这55个国家和地区进行聚类,画出谱系图并比较各个方法的聚类结果的异同。

4.4根据第三章习题8中关于 植物花的形状尺寸距离,将第一类G1和第二类G2看成变量,定义各样品间的距离为欧氏距X??X1,X2,X3,X4?的100个观测值(即100个样品)

T离,利用某种谱系聚类法(最小距离法,最大距离法或类平均法)作如下聚类分析, (1)以X?X1为指标变量。 (2)以X??X1,X2?为指标变量。

T(3)以X??X1,X2,X3?为指标变量。

T(4)以X??X1,X2,X3,X4?为指标变量。

T(5)若将这100个样品分为两类,以上4种聚类结果和实际分类相比,效果如何?是否所

用指标变量越多,聚类效果就越好?

第五章 非参数秩方法

5.2为了解一种新的术后护理方法和原护理方法相比是否可以显著缩短病人手术后的回复时间,随机地将作完某种手术的18位病人分为两组,每组9人,按不同方法护理,观测到他们的恢复时间(单位:天)如下:

原方法:20,21,24,30,32,36,40,48,54;

新方法:19,22,25,26,28,29,34,37,38.

在??0.05下检验新方法是否显著地缩短了病人手术后的恢复时间。如果对新护理方法是否是缩短还是延长了恢复时间事先并不清楚,情况又如何?

5.5为检验维生素B1对刺激蘑菇生长的作用是否显著,从24朵大小相近的小蘑菇中随机的选出13朵施以维生素B1,另外11朵不施维生素B1,其他条件保持相同。一段时间后测得两组蘑菇的重量如下:

使用维生素B1:27,34,20.5,29.5,20,28,19.5,26.5,22,24.5,34,35.5,19, 未用维生素B1:18,14.5,13.5,12.5,23,24,21,17,18.5,9.5,14.

利用正态逼近求Wilcoxon秩和检验的p值,在??0.05下,维生素B1对刺激蘑菇生长的效果是否显著。

5.6为了比较两种不同的心理咨询方法的效果,将80位接受心理咨询的人随机的划分为两组,每组40人,其中一组接受一般的心理咨询,另一组接受特殊的心理咨询,试验结束后,将每个人的心理调整效果作仔细评估 ,并分为好,较好,较差和差四档,数据如下:

咨询方法 好 分类 一般 特殊 4 8 6 10 17 14 13 8 较好 较差 差

利用Wilcoxon秩和检验法检验特殊心理咨询方法的效果是否显著优于一般方法(??0.10)。

5.8利用Smirnov检验法求第二题中的检验p值。

5.9从同一工厂的三条不同的白糖包装线上分别抽取5袋、5袋和4袋白糖,测得其净重量如下(单位:克),

第一条包装线:487,492,510,507,488; 第二条包装线:500,498,503,501,512; 第三条包装线:495,494,506,499.

给定??0.10,利用Kruskal-Wallis方法检验这三条包装线包装白糖的重量有无显著差异。

5.14为考察两种不同催化剂对某一化工产品得率的影响,作试验9次,测得数据如下: 催化剂

0.38 0.45 0.72 0.66 0.75 0.68 0.44 0.31 0.32

A 催化剂0.21 0.23 0.45 0.60 0.77 0.65 0.60 0.83 0.21 B 利用双边符号检验法和双边Wilcoxon符号秩检验法检验这两种催化剂对该化工产品得率的影响是否显著。用正态逼近情况如何?(??0.05)。

5.15有两种不同的水稻品种,分别种植在一分为二的10块田地上,得到它们的产量(单位:公斤)如下: 品种363 A 品种379 B 356 443 332 337 356 356 348 340 345 435 345 345 396 396 356 387 371 383 利用Wilcoxon符号秩检验法检验这两种水稻品种的产量是否有显著差异(??0.05)。 5.16为了研究四种不同药品对治疗咳嗽的效果是否相同,有7位患者参加试验。每位患者在指定的不连续的4天内随机地服用这四种药品,记录这位患者在这4天内咳嗽的次数如下: 患者 药品 A B C D 251 207 167 301 126 180 104 120 49 123 63 186 45 85 147 100 233 232 236 250 291 208 158 183 1385 1204 1611 1913 1 2 3 4 5 6 7

利用Friedman检验和改进的Friedman检验法检验这四种药品对咳嗽的疗效是否相同(??0.05)。

第六章 列联表的独立性分析

6.2 为研究患肺癌是否与吸烟量有关,共计调查肺癌患者及其它疾病的患者各1357人,按每天平均吸烟量(单位:支)分类得如下表:

患者类型 吸烟量 0 1~4 5~14 15~24 25~49 ?50 肺癌 7 55 489 475 293 38 其他疾病 61 129 570 431 154 12

Pearson ?统计量被用以检验患肺癌是否与吸烟量有关,求检验的p值。

2第七章 试验设计

7.5交沙霉素片剂处方探索试验。

交沙霉素片在1991年事一种新型抗菌素,对多种疾病有确切疗效且毒副作用小,但其原


应用数理统计习题(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:提案工作报告2012

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: