R语言学习详解(3)

2018-12-11 21:21

相关系数用cor(x,y=NULL,use=\x<-c(44.4,45.9,46.0,46.5,46.7,47,48.7,49.2,60.1) #输入x y<-c(2.6,10.1,11.5,30.0,32.6,50.0,55.2,85.8,86.8) #输入y cor(x,y) #计算pearson相关系数 cor(x,y,method=\ #计算spearman秩相关系数 cor(x,y,method=\ #计算kendall系数

分类数据的描述性统计分析直接输入列联表

Eye.Hair<-matrix(c(68,20,15,5,119,84,54,29,26,17,14,14,7,94,10,16),nrow=4,byrow=T) colnames(Eye.Hair)<-c(\ #列命名 rownames(Eye.Hair)<-c(\ #行命名由原始数据构造列联表

table(state.division, state.region) #由原始数据构造不同division与不同region的列联表

获得边际列表

margin.table(Eye.Hair,1) #获得列边际列表 margin.table(Eye.Hair,2) #获得行边际列表

round(prop.table(Eye.Hair,1),digits=2) #获得频率列联表

round(prop.table(Eye.Hair,1),digits=2)*100 #获得频率百分比列联表 data(HairEyeColor) #载入数据集HairEyeColor a<-as.table(apply(HairEyeColor,c(1,2),sum)) # barplot(a,legend.text=attr(a,\

barplot(a,beside=TRUE,legend.text=attr(a,\

点估计

1、矩估计按计算的原理来求 2、极大似然估计

A）单参数情形下：用optimize()函数求极值

f<-function(P)(P^517)*(1-P)^483 #定义函数 optimize(f,c(0,1),maximum=TRUE) #求极大值 B）多参数情形下：用optim,nlm函数求极值

nlm函数采用牛顿-拉夫逊算法求函数的最小值点。函数optim提供method选项给出的5种方法中的一种进行优化。都是多维求极值函数。

区间估计单正态总体

1、方差已知，均值未知，求均值的置信区间：

没有现成的函数，现编：

conf.int<-function(x,n,sigma,alpha){

options(digits=4)

mean<-mean(x)

c(mean-sigma*qnorm(1-alpha/2,mean=0,sd=1,

lower.tail=TRUE)/sqrt(n), mean+sigma*qnorm(1-alpha/2,mean=0,sd=1, lower.tail=TRUE)/sqrt(n)) } #方差已知时求置信区间函数 x<-c(175,176,173,175,174,173,173,176,173,179) #输入x

conf.int(x,10,1.5,0.05) #求标准差为1.5的x的置信度0.95的置信区间。

2、方差未知，均值未知，求均值的置信区间：

x<-c(175,176,173,175,174,173,173,176,173,179) #输入x t.test(x,conf.level=0.95) #求t-检验以及置信区间 t.test(x, conf.level=0.95)$conf.int #只求置信区间

3、方差未知，均值未知，求方差的置信区间：

没有现成函数，需要现编

双正态总体

1、两方差已知，两均值未知，求均值差u1-u2的置信区间：

没有现成函数，需要现编

2、两方差未知但相等，两均值未知，求均值差u1-u2的置信区间：

x<-c(628,583,510,554,612,523,530,615) #输入x y<-c(535,433,398,470,567,480,498,560,503,426) #输入y

t.test(x,y,var.equal=TRUE) #求t-检验以及均值差的置信区间 3、两方差未知不等，两均值未知，求均值差u1-u2的置信区间：

t.test(x,y,var.equal=FALSE) #求t-检验以及均值差的置信区间 4、两方差未知，两均值未知，求方差比的置信区间：

x<-c(20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9) #输入x y<-c(20.7,19.8,19.5,20.8,20.4,19.6,20.2) #输入y var.test(x,y) #求F-检验以及方差比的置信区间

单总体比例的区间估计

prop.test(38,200,correct=TRUE) #求从3042人的人名录中随机抽取的200个中有38人的地址变动情况下名录需要修改地址比例的置信区间

两总体比例差p1-p2的区间估计

like<-c(478,246) #A、B两地喜欢某品牌的人数 people<-c(1000,750) #A、B两地被调查人数 prop.test(like,people) #求置信区间

假设检验单正态总体

1、方差已知时，检验均值是否为u0：

没有现成的函数，需编：

2、方差未知时，检验均值是否为mu：

salt<-c(490,506,508,502,498,511,510,515,512) #输入salt t.test(salt,mu=500) #求t-检验

3、均值未知，检验方差是否为sigma0：

没有现成函数，需要现编

双正态总体

1、两方差已知，检验均值相同u1=u2：

没有现成函数，需要现编

2、两方差未知但相等，检验均值相同u1=u2：

x<-c(20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9) #输入x y<-c(20.7,19.8,19.5,20.8,20.4,19.6,20.2) #输入y t.test(x,y,var.equal=TRUE) #求t-检验 3、两方差未知不等，检验均值相同u1=u2：

t.test(x,y,var.equal=FALSE) #求t-检验 4、两均值未知，求方差比的F检验：

x<-c(20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9) #输入x y<-c(20.7,19.8,19.5,20.8,20.4,19.6,20.2) #输入y var.test(x,y) #求F-检验 5、成对数据的t-检验：

x<-c(20.5,18.8,19.8,20.9,21.5,19.5,21.0,21.2) #输入x y<-c(17.7,20.3,20.0,18.8,19.0,20.1,20.0,19.1) #输入y

t.test(x,y,paired=TRUE) #求成对数的t-检验

单总体比例的检验 A）精确检验

binom.test(c(7,5),p=0.4) #抽12件发现7件次品，问次品率为0.4是否成立

B）近似检验

prop.test(7,12, p=0.4,correct=TRUE) #抽12件发现7件次品，问次品率为0.4是否成立

两总体比例的检验

sucess<-c(23,25) #被调查的男、女生家中有计算机的比例 total<-c(102,135) #被调查的男、女生人数 prop.test(sucess, total) #求两者比例是否一致

方差分析

A) 单因子方差分析

因素A1A2A3A4A5A代表销售方式销售方式与销售量销售量数据25.622.22824.430292527.72328.82831.520.621.22229.827.532.225.921.2

A<-factor(rep(1:5,each=4)) #对应因子的不同水平输入A miscellany<-data.frame(x,A) #建立数据集miscellany aov.mis<-aov(x~A,data=miscellany) #方差分析 summary(aov.mis) #导出方差分析表

plot(miscellany$x~miscellany$A) #作出不同水平的比较图

pairwise.t.test(x,A,p.adjust.method=\ #多重t-检验，第一类错误不调整，调整的话，可以用默认的holm，或bonferroni等

方差齐性检验-levene检验 library(car)

leveneTest(x,A) #检验方差是否齐性，即各变量方差是否一致

B) 双因子方差分析

I）无交互作用的方差分析

因素B10.05A1A20.08A30.11A40.11A：四种检测方法果汁含铅比测试B2B3B40.460.120.380.40.430.050.440.08B：6种不同果汁B50.160.10.10.030.840.920.940.93B61.31.571.11.15

II）

juice<-data.frame(

X=c(0.05,0.46,0.12,0.16,0.84,1.30,0.08,0.38,0.40,0.10,0.92,1.57,0.11,0.43,0.05,0.10,0.94,1.10,0.11,0.44,0.08,0.03,0.93,1.15), A=gl(4,6), B=gl(6,1,24)

) #其中gl(4,6)是设因子函数，4表示4个水平，6表示重复次数，gl(6,1,24)是设因子函数，6表示6个水平，1表示重复次数，24表示结果的长度

juice.aov<-aov(X~A+B,data=juice) #无交互作用的双因素方差分析 summary(juice.aov) #提取方差分析表

有交互作用的方差分析

老鼠存活时间（年）的实验报告因素IIIIII0.310.430.380.440.220.23AB########0.430.82########0.760.45########0.230.92########0.400.56########0.230.30########0.220.30CD########################################################################A、B、C、D为四种治疗方案,I、II、III为三种毒药

rats<-data.frame(

Time=c(0.31,0.45, 0.43,0.45, 0.46,0.43, 0.63,0.76,0.82,1.10, 0.45,0.71,0.88,0.72, 0.66,0.62, 0.38,0.29, 0.44,0.35,0.40,0.23, 0.31,0.40,0.92,0.61, 0.56,1.02, 0.49,1.24, 0.71,0.38, 0.22,0.21,

0.23,0.25, 0.18,0.23, 0.24,0.22,0.30,0.37,0.30,0.36, 0.38,0.29,0.31,0.33), Toxicant=gl(3,16,48,labels=c(\Cure=gl(4,4,48,labels=c(\)

op<-par(mfrow=c(1,2)) #画图区域分为两块

plot(Time~Toxicant+Cure,data=rats) #作毒药和治疗方案各自的效应分析

with(rats,interaction.plot(Toxicant,Cure,Time,trace.label=\#治疗方案的交互效应图

with(rats,interaction.plot(Cure, Toxicant,Time,trace.label=\ #毒药的交互效应图

rats.aov<-aov(Time~Toxicant*Cure,data=rats) #有交互作用的双因素方差分析

summary(rats.aov) #提取方差分析表