Min 1Q Median 3Q Max -31.486 -8.282 -1.674 5.623 59.337
Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) 59.2590 7.4200 7.986 5.67e-07 *** X1 1.8434 0.4789 3.849 0.00142 ** ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 20.05 on 16 degrees of freedom
Multiple R-squared: 0.4808, Adjusted R-squared: 0.4484 F-statistic: 14.82 on 1 and 16 DF, p-value: 0.001417
此时常数项的检测结果为极为显著,X1项系数为很显著。方程式P-值为0.001417<0.05且比之前的值都低。
X1 由此得到了最优回归方程:Y?59.259?1.8434
3. 方差分析I 解:
(1)首先提出假设H0不同饲料的小鼠肝中铁含量无显著差异,μ1=μ2=μ3;H1不同饲料的小鼠
肝中铁含量有显著差异,μ1,μ2,μ3不全相等。
使用R软件求解,用数据框的格式输入数据,调用aov()函数计算方差分析,编程如下: > mouse<-data.frame(
+ X=c(1.00, 1.01, 1.13, 1.14, 1.70, 2.01, 2.23, 2.63, + 0.96, 1.23, 1.54, 1.96, 2.94, 3.68, 5.59, 6.96, + 2.07, 3.72, 4.50, 4.90, 6.00, 6.84, 8.23, 10.33), + A=factor(rep(1:3, c(8,8,8))) + )
> mouse.lm<-lm(X ~ A, data=mouse) > anova(mouse.lm) 得到如下结果:
Analysis of Variance Table
Response: X
Df Sum Sq Mean Sq F value Pr(>F) A 2 73.118 36.559 9.104 0.001422 ** Residuals 21 84.329 4.016 ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.从结果中看到P-值为0.001422<0.05,因此原
假设是不成立的,拒绝H0,即不同饲料的小鼠肝中铁含量有显著差异。
?(2) 继续使用R软件来分析哪些水平之间有显著差异。 首先计算数据在各水平下的均值: > attach(mouse) > tapply(X, A, mean)
得到如下结果:
1 2 3 1.60625 3.10750 5.82375
可以看出不同饲料喂食下的小鼠肝中铁含量的均值已有明显差异。 再做多重t检测: > pairwise.t.test(X, A) 得到如下结果:
Pairwise comparisons using t tests with pooled SD
data: X and A
1 2 2 0.1489 - 3 0.0012 0.0262
P value adjustment method: holm
由计算结果得出结论,μ1与μ3、μ2与μ3是有显著差异的,而μ1与μ2没有显著差异。即
是说,喂食饲料A和喂食饲料B情况下小鼠肝中铁含量有显著差异;喂食饲料B和喂食饲料C情况下小鼠肝中铁含量有显著差异;喂食饲料A和喂食饲料B情况下小鼠肝中铁含量无显著差异。
进一步,使用plot()函数画出线箱图并保存: > plot(X~A, col=5:7,
+ main=\> detach(mouse) >
> savePlot(\
Box-and-Whisker Plot of Mouse Data10X246812A3
可以直观看到数据的水平及各因素之间的差异。
(3) 根据题意,先编写程序,做Shapiro-Wilk正态性检验 > attach(mouse)
> tapply(X,A,shapiro.test)
得到如下结果: $`1`
Shapiro-Wilk normality test
data: X[[1L]]
W = 0.8742, p-value = 0.1656 $`2`
Shapiro-Wilk normality test
data: X[[2L]]
W = 0.8893, p-value = 0.2306
$`3`
Shapiro-Wilk normality test
data: X[[3L]]
W = 0.985, p-value = 0.9833
结果显示三组数据均数据满足正态性。 再用Bartlett函数做方差齐性检验: > attach(mouse) > bartlett.test(X, A) 得到如下结果:
Bartlett test of homogeneity of variances
data: X and A
Bartlett's K-squared = 10.5677, df = 2, p-value = 0.005073
从结果中看到p-值为0.005073<0.05因此认为数据并不满足方差齐性。
对于只满足正态性,不满足齐性要求的数据,用函数oneway.test()作方差分析: > oneway.test(X~A, data=mouse)
得到方差的分析结果:
One-way analysis of means (not assuming equal variances)
data: X and A
F = 10.3592, num df = 2.00, denom df = 10.51, p-value = 0.003271
此时P-值较第一问计算时的结果有所增大,但是仍然满足p-值<0.05因此可以认为原假设是
不成立的,拒绝H0,即不同饲料的小鼠肝中铁含量有显著差异。
4. 方差分析II 解:
(1)设有A、B两个因素,因素A有3个水平A1、A2、A3,因素B有3个水平B1、B2、
B3。
利用R软件来进行判断:
> tree.aov <- aov(Y ~ A+B+A:B, data=tree) > factory<-data.frame(
+ Y=c(4.6,4.3,6.1,6.5,6.8,6.4,6.3,3.7,3.4, + 3.8,4.0,3.8,4.7,4.3,3.9,3.5,6.5,7.0), + B=gl(3,6,18), + A=gl(3,2,18) + )
> factory.aov<-aov(Y~A+B+A:B,data=factory) > summary(factory.aov) 得到结果:
Df Sum Sq Mean Sq F value Pr(>F)
A 2 5.408 2.704 6.130 0.02090 * B 2 7.841 3.921 8.888 0.00740 ** A:B 4 12.192 3.048 6.910 0.00793 ** Residuals 9 3.970 0.441 ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1
结果显示有交互作用时在显著水平0.05下,因素A(反应温度)效应显著,而因素B(反应
压力)和交互效应很显著。
(2)使用R软件求解各种反应温度下产量均值的估计: > attach(factory) > tapply(Y, A, mean)
得到如下结果:
1 2 3 4.650000 4.533333 5.750000
计算各种反应压力下产量均值的估计: > tapply(Y, B, mean)
得到如下结果:
1 2 3 5.783333 4.166667 4.983333
计算同时考虑温度和压力下产量均值的估计: > matrix(tapply(Y, A:B, mean), nr=3, nc=3, byrow=T, + dimnames=list(levels(A), levels(B)))
得到如下结果:
1 2 3 1 4.45 5.0 4.50 2 6.30 3.6 3.70 3 6.60 3.9 6.75
(3) 从第一问结果因素A(反应温度)效应显著、而因素B(反应压力)和交互效应很显著
来看第二问得到的数据即可得到答案。 各种反应温度下产量均值中3条件下最多; 各种反应压力下产量均值中1条件下最多;
交互效应下3、3条件的产量均值最多,且高于单独作用时的产量均值; 综合看来,选用3、3条件是最佳的,即采用80℃的反应温度
3公斤的反应压力时对生产最有利。
7.3 加分实验 解:
根据题意,明确解题思路,要解决的问题是:是否有理由认为某一厂家的产品比其他厂家的