北京工业大学-数学建模7-数理统计实验201312(2)

2019-06-17 12:48

ratio of variances 1.598361

由于p-value = 0.3153>>0.05,故接受原假设,认为检验组和试验组两总体的方差是相同的。

4.假设检验III

某医院研究乳腺癌家族史对于乳腺癌发病率的影响。假设调查了10000名50-54岁的妇女,她们的母亲曾有乳腺癌。发现她们在那个生存期的某个时刻有400例乳腺癌,而全国在该年龄段的妇女乳腺癌的患病率为2%,这组数据能否说明乳腺癌的患病率与家族遗传有关。

解:调用函数binom.test()进行二项分布总体的假设检验

根据题意,所检验的问题为:

H0:p?p0?0.02,H1:p?p0

调用binom.test()函数: >binom.test(400,10000,p=0.02) 检验结果为:

Exact binomial test data: 400 and 10000

number of successes = 400, number of trials = 10000, p-value < 2.2e-16

alternative hypothesis: true probability of success is not equal to 0.02 95 percent confidence interval: 0.03624378 0.04402702 sample estimates: probability of success 0.04

由于p-value <2.2e-16<<0.05,故拒绝原假设,即认为乳腺癌的患病率与家族遗传显著有关。

5.分布检验I

Mendel用豌豆的两对相对性状进行杂交实验,黄色圆滑种子与绿色皱缩种子的豌豆杂交后,第二代根据自由组合规律,理论分离比为:

黄圆:黄皱:绿圆:绿皱=9/16:3/16:3/16:1/16

实际实验值为:黄圆315粒,黄皱101粒,绿圆108粒,绿皱32粒,共556粒,问此结果是否符合自由组合规律? 解:根据题意,

H0:p1?9331,p2?,p3?,p4?. 16161616调用chisq.test()函数,其命令如下: >chisq.test(c(315,101,108,32),p=c(9,3,3,1)/16) Chi-squared test for given probabilities data: c(315, 101, 108, 32)

X-squared = 0.47, df = 3, p-value = 0.9254

由于p-value = 0.9254>>0.05,故接受原假设,此结果符合自由组合规律。

6.分布检验II

观察每分钟进入某商店的人数X,任取200分钟,所得数据如表7.1所示,试分析,能否认为每分钟顾客数X服从Possion分布(α=0.1)

表7.1 数据表

顾客人数 0 频数 92 1 68 2 28 3 11 4 1 5 0 解:假设:H0:每分钟顾客数服从泊松分布

编写相应的计算程序如下: X<-0:5; Y<-c(92,68,28,11,1,0)

q<-ppois(X,mean(rep(X,Y)));n<-length(Y) ####其中mean(rep(X,Y))为样本均值 p<-q[1];p[n]<-1-q[n-1] for(i in 2:(n-1)) p[i]<-q[i]-q[i-1]

chisq.test(Y, p=p) 运行结果如下:

Chi-squared test for given probabilities data: Y

X-squared = 2.1596, df = 5, p-value = 0.8267 Warning message:

In chisq.test(Y, p = p) : Chi-squared approximation may be incorrect

出现了警告,究其原因是由于顾客为4人和5人对应的频数小于5,故将4人、5人与3人的情况合并,调整运行程序:

Z<-c(92,68,28,12)

n<-length(Z);p<-p[1:n-1];p[n]<-1-q[n-1] chisq.test(Z, p=p) 运行结果为:

Chi-squared test for given probabilities

data: Z

X-squared = 0.9113, df = 3, p-value = 0.8227

由于p-value = 0.8227>>0.05,故接受原假设,可以认为每分钟顾客数X服从Possion分布。

7.分布检验III

一般认为长途电话通过电话总机的过程是一个随机过程,其间打进电话的时间间隔服从指数分布。某个星期下午1:00以后最先打进的10个电话的时间为:

1:06 1:08 1:16 1:22 1:23 1:34 1:44 1:47 1:51 1:57

试用Kolmogorov-Smirnov检验分析打进电话的时间间隔是否服从指数分布。 解:打进电话的时间间隔(分钟)依次为:

6 2 8 6 1 11 10 3 4 6 将时间间隔按照由小到大排序为: 1 2 3 4 6 6 6 8 10 11 均值为5.7

下面检验时间间隔是否服从??1/5.7的指数分布: 假设:H0: 时间间隔服从指数分布

输入数据,调用ks.test()函数,其命令如下:

X<-c(1, 2, 3, 4, 6, 6, 6, 8, 10, 11)

ks.test(X, \运行结果为:

One-sample Kolmogorov-Smirnov test data: X

D = 0.251, p-value = 0.5545 alternative hypothesis: two-sided Warning message: In ks.test(X, \

ties should not be present for the Kolmogorov-Smirnov test

运行结果出现了警告,数据中出现相同的值。对程序进行调整:

X<-c(1, 2, 3, 4, 6, 8, 10, 11)

ks.test(X, \运行结果为:

One-sample Kolmogorov-Smirnov test data: X

D = 0.1742, p-value = 0.9357 alternative hypothesis: two-sided

可见,调整前后P值都大于0.05,故接受原假设,认为打进电话的时间间隔服从指数分布

8.列联表检验I

向120名女性和120名男性做调查,了解他们关于给谁买节日礼物最难的看法,调查结果如表7.2所示。试分析:女性和男性在关于给谁买节日礼物最难的看法上有没有显著差异。

表7.2 关于给谁买节日礼物最难的看法

给谁买节日礼物最难 性别 女性 男性 配偶 28 42 父母 34 31 子女 23 9 兄弟姐妹 7 11 姻亲 13 7 其他亲属 15 20 解:假设:H0:男性女性在看法上是独立的,即没有显著差异。

H1:看法上有显著差异。

输入数据,调用chisq.test做列联表独立性检验: x<-scan() 28 34 23 7 13 15 42 31 9 11 7 20

X<-matrix(x, nc=4, nr=2, byrow=T) chisq.test(X) 运行结果为:

Pearson's Chi-squared test data: X

X-squared = 33.2194, df = 3, p-value = 2.895e-07

由于P值<<0.05,故拒绝原假设的独立性,即女性和男性在关于给谁买节日礼物最难的看法上是相关的,有显著差异。

9.列联表检验II

为研究人脑的左右半球恶性肿瘤的发病率是否有显著差异,对人脑恶性肿瘤和良性肿瘤的发病情况做了调查,调查结果如表7.3所示。试进行分析。

表7.3 人脑左右半球恶性肿瘤和良性肿瘤的发病情况

左半球 右半球 合计 良性 9 1 10 恶性 3 3 6 合计 12 4 16 解:假设:H0:人脑左右半球恶性肿瘤发病率独立,即没有显著差异。


北京工业大学-数学建模7-数理统计实验201312(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:第三轮相189种白话解释

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: