ratio of variances 1.598361
由于p-value = 0.3153>>0.05,故接受原假设,认为检验组和试验组两总体的方差是相同的。
4.假设检验III
某医院研究乳腺癌家族史对于乳腺癌发病率的影响。假设调查了10000名50-54岁的妇女,她们的母亲曾有乳腺癌。发现她们在那个生存期的某个时刻有400例乳腺癌,而全国在该年龄段的妇女乳腺癌的患病率为2%,这组数据能否说明乳腺癌的患病率与家族遗传有关。
解:调用函数binom.test()进行二项分布总体的假设检验
根据题意,所检验的问题为:
H0:p?p0?0.02,H1:p?p0
调用binom.test()函数: >binom.test(400,10000,p=0.02) 检验结果为:
Exact binomial test data: 400 and 10000
number of successes = 400, number of trials = 10000, p-value < 2.2e-16
alternative hypothesis: true probability of success is not equal to 0.02 95 percent confidence interval: 0.03624378 0.04402702 sample estimates: probability of success 0.04
由于p-value <2.2e-16<<0.05,故拒绝原假设,即认为乳腺癌的患病率与家族遗传显著有关。
5.分布检验I
Mendel用豌豆的两对相对性状进行杂交实验,黄色圆滑种子与绿色皱缩种子的豌豆杂交后,第二代根据自由组合规律,理论分离比为:
黄圆:黄皱:绿圆:绿皱=9/16:3/16:3/16:1/16
实际实验值为:黄圆315粒,黄皱101粒,绿圆108粒,绿皱32粒,共556粒,问此结果是否符合自由组合规律? 解:根据题意,
H0:p1?9331,p2?,p3?,p4?. 16161616调用chisq.test()函数,其命令如下: >chisq.test(c(315,101,108,32),p=c(9,3,3,1)/16) Chi-squared test for given probabilities data: c(315, 101, 108, 32)
X-squared = 0.47, df = 3, p-value = 0.9254
由于p-value = 0.9254>>0.05,故接受原假设,此结果符合自由组合规律。
6.分布检验II
观察每分钟进入某商店的人数X,任取200分钟,所得数据如表7.1所示,试分析,能否认为每分钟顾客数X服从Possion分布(α=0.1)
表7.1 数据表
顾客人数 0 频数 92 1 68 2 28 3 11 4 1 5 0 解:假设:H0:每分钟顾客数服从泊松分布
编写相应的计算程序如下: X<-0:5; Y<-c(92,68,28,11,1,0)
q<-ppois(X,mean(rep(X,Y)));n<-length(Y) ####其中mean(rep(X,Y))为样本均值 p<-q[1];p[n]<-1-q[n-1] for(i in 2:(n-1)) p[i]<-q[i]-q[i-1]
chisq.test(Y, p=p) 运行结果如下:
Chi-squared test for given probabilities data: Y
X-squared = 2.1596, df = 5, p-value = 0.8267 Warning message:
In chisq.test(Y, p = p) : Chi-squared approximation may be incorrect
出现了警告,究其原因是由于顾客为4人和5人对应的频数小于5,故将4人、5人与3人的情况合并,调整运行程序:
Z<-c(92,68,28,12)
n<-length(Z);p<-p[1:n-1];p[n]<-1-q[n-1] chisq.test(Z, p=p) 运行结果为:
Chi-squared test for given probabilities
data: Z
X-squared = 0.9113, df = 3, p-value = 0.8227
由于p-value = 0.8227>>0.05,故接受原假设,可以认为每分钟顾客数X服从Possion分布。
7.分布检验III
一般认为长途电话通过电话总机的过程是一个随机过程,其间打进电话的时间间隔服从指数分布。某个星期下午1:00以后最先打进的10个电话的时间为:
1:06 1:08 1:16 1:22 1:23 1:34 1:44 1:47 1:51 1:57
试用Kolmogorov-Smirnov检验分析打进电话的时间间隔是否服从指数分布。 解:打进电话的时间间隔(分钟)依次为:
6 2 8 6 1 11 10 3 4 6 将时间间隔按照由小到大排序为: 1 2 3 4 6 6 6 8 10 11 均值为5.7
下面检验时间间隔是否服从??1/5.7的指数分布: 假设:H0: 时间间隔服从指数分布
输入数据,调用ks.test()函数,其命令如下:
X<-c(1, 2, 3, 4, 6, 6, 6, 8, 10, 11)
ks.test(X, \运行结果为:
One-sample Kolmogorov-Smirnov test data: X
D = 0.251, p-value = 0.5545 alternative hypothesis: two-sided Warning message: In ks.test(X, \
ties should not be present for the Kolmogorov-Smirnov test
运行结果出现了警告,数据中出现相同的值。对程序进行调整:
X<-c(1, 2, 3, 4, 6, 8, 10, 11)
ks.test(X, \运行结果为:
One-sample Kolmogorov-Smirnov test data: X
D = 0.1742, p-value = 0.9357 alternative hypothesis: two-sided
可见,调整前后P值都大于0.05,故接受原假设,认为打进电话的时间间隔服从指数分布
8.列联表检验I
向120名女性和120名男性做调查,了解他们关于给谁买节日礼物最难的看法,调查结果如表7.2所示。试分析:女性和男性在关于给谁买节日礼物最难的看法上有没有显著差异。
表7.2 关于给谁买节日礼物最难的看法
给谁买节日礼物最难 性别 女性 男性 配偶 28 42 父母 34 31 子女 23 9 兄弟姐妹 7 11 姻亲 13 7 其他亲属 15 20 解:假设:H0:男性女性在看法上是独立的,即没有显著差异。
H1:看法上有显著差异。
输入数据,调用chisq.test做列联表独立性检验: x<-scan() 28 34 23 7 13 15 42 31 9 11 7 20
X<-matrix(x, nc=4, nr=2, byrow=T) chisq.test(X) 运行结果为:
Pearson's Chi-squared test data: X
X-squared = 33.2194, df = 3, p-value = 2.895e-07
由于P值<<0.05,故拒绝原假设的独立性,即女性和男性在关于给谁买节日礼物最难的看法上是相关的,有显著差异。
9.列联表检验II
为研究人脑的左右半球恶性肿瘤的发病率是否有显著差异,对人脑恶性肿瘤和良性肿瘤的发病情况做了调查,调查结果如表7.3所示。试进行分析。
表7.3 人脑左右半球恶性肿瘤和良性肿瘤的发病情况
左半球 右半球 合计 良性 9 1 10 恶性 3 3 6 合计 12 4 16 解:假设:H0:人脑左右半球恶性肿瘤发病率独立,即没有显著差异。