R语言学习详解(3)

2018-12-11 21:21

相关系数用cor(x,y=NULL,use=\x<-c(44.4,45.9,46.0,46.5,46.7,47,48.7,49.2,60.1) #输入x y<-c(2.6,10.1,11.5,30.0,32.6,50.0,55.2,85.8,86.8) #输入y cor(x,y) #计算pearson相关系数 cor(x,y,method=\ #计算spearman秩相关系数 cor(x,y,method=\ #计算kendall系数

分类数据的描述性统计分析 直接输入列联表

Eye.Hair<-matrix(c(68,20,15,5,119,84,54,29,26,17,14,14,7,94,10,16),nrow=4,byrow=T) colnames(Eye.Hair)<-c(\ #列命名 rownames(Eye.Hair)<-c(\ #行命名 由原始数据构造列联表

table(state.division, state.region) #由原始数据构造不同division与不同region的列联表

获得边际列表

margin.table(Eye.Hair,1) #获得列边际列表 margin.table(Eye.Hair,2) #获得行边际列表

round(prop.table(Eye.Hair,1),digits=2) #获得频率列联表

round(prop.table(Eye.Hair,1),digits=2)*100 #获得频率百分比列联表 data(HairEyeColor) #载入数据集HairEyeColor a<-as.table(apply(HairEyeColor,c(1,2),sum)) # barplot(a,legend.text=attr(a,\

barplot(a,beside=TRUE,legend.text=attr(a,\

点估计

1、 矩估计按计算的原理来求 2、 极大似然估计

A) 单参数情形下:用optimize()函数求极值

f<-function(P)(P^517)*(1-P)^483 #定义函数 optimize(f,c(0,1),maximum=TRUE) #求极大值 B) 多参数情形下:用optim,nlm函数求极值

nlm函数采用牛顿-拉夫逊算法求函数的最小值点。函数optim提供method选项给出的5种方法中的一种进行优化。都是多维求极值函数。

区间估计 单正态总体

1、 方差已知,均值未知,求均值的置信区间:

没有现成的函数,现编:

conf.int<-function(x,n,sigma,alpha){

options(digits=4)

mean<-mean(x)

c(mean-sigma*qnorm(1-alpha/2,mean=0,sd=1,

lower.tail=TRUE)/sqrt(n), mean+sigma*qnorm(1-alpha/2,mean=0,sd=1, lower.tail=TRUE)/sqrt(n)) } #方差已知时求置信区间函数 x<-c(175,176,173,175,174,173,173,176,173,179) #输入x

conf.int(x,10,1.5,0.05) #求标准差为1.5的x的置信度0.95的置信区间。

2、 方差未知,均值未知,求均值的置信区间:

x<-c(175,176,173,175,174,173,173,176,173,179) #输入x t.test(x,conf.level=0.95) #求t-检验以及置信区间 t.test(x, conf.level=0.95)$conf.int #只求置信区间

3、 方差未知,均值未知,求方差的置信区间:

没有现成函数,需要现编

双正态总体

1、 两方差已知,两均值未知,求均值差u1-u2的置信区间:

没有现成函数,需要现编

2、 两方差未知但相等,两均值未知,求均值差u1-u2的置信区间:

x<-c(628,583,510,554,612,523,530,615) #输入x y<-c(535,433,398,470,567,480,498,560,503,426) #输入y

t.test(x,y,var.equal=TRUE) #求t-检验以及均值差的置信区间 3、 两方差未知不等,两均值未知,求均值差u1-u2的置信区间:

t.test(x,y,var.equal=FALSE) #求t-检验以及均值差的置信区间 4、 两方差未知,两均值未知,求方差比的置信区间:

x<-c(20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9) #输入x y<-c(20.7,19.8,19.5,20.8,20.4,19.6,20.2) #输入y var.test(x,y) #求F-检验以及方差比的置信区间

单总体比例的区间估计

prop.test(38,200,correct=TRUE) #求从3042人的人名录中随机抽取的200个中有38人的地址变动情况下名录需要修改地址比例的置信区间

两总体比例差p1-p2的区间估计

like<-c(478,246) #A、B两地喜欢某品牌的人数 people<-c(1000,750) #A、B两地被调查人数 prop.test(like,people) #求置信区间

假设检验 单正态总体

1、 方差已知时,检验均值是否为u0:

没有现成的函数,需编:

2、 方差未知时,检验均值是否为mu:

salt<-c(490,506,508,502,498,511,510,515,512) #输入salt t.test(salt,mu=500) #求t-检验

3、 均值未知,检验方差是否为sigma0:

没有现成函数,需要现编

双正态总体

1、 两方差已知,检验均值相同u1=u2:

没有现成函数,需要现编

2、 两方差未知但相等,检验均值相同u1=u2:

x<-c(20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9) #输入x y<-c(20.7,19.8,19.5,20.8,20.4,19.6,20.2) #输入y t.test(x,y,var.equal=TRUE) #求t-检验 3、 两方差未知不等,检验均值相同u1=u2:

t.test(x,y,var.equal=FALSE) #求t-检验 4、 两均值未知,求方差比的F检验:

x<-c(20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9) #输入x y<-c(20.7,19.8,19.5,20.8,20.4,19.6,20.2) #输入y var.test(x,y) #求F-检验 5、 成对数据的t-检验:

x<-c(20.5,18.8,19.8,20.9,21.5,19.5,21.0,21.2) #输入x y<-c(17.7,20.3,20.0,18.8,19.0,20.1,20.0,19.1) #输入y

t.test(x,y,paired=TRUE) #求成对数的t-检验

单总体比例的检验 A) 精确检验

binom.test(c(7,5),p=0.4) #抽12件发现7件次品,问次品率为0.4是否成立

B) 近似检验

prop.test(7,12, p=0.4,correct=TRUE) #抽12件发现7件次品,问次品率为0.4是否成立

两总体比例的检验

sucess<-c(23,25) #被调查的男、女生家中有计算机的比例 total<-c(102,135) #被调查的男、女生人数 prop.test(sucess, total) #求两者比例是否一致

方差分析

A) 单因子方差分析

因素A1A2A3A4A5A代表销售方式销售方式与销售量销售量数据25.622.22824.430292527.72328.82831.520.621.22229.827.532.225.921.2

A<-factor(rep(1:5,each=4)) #对应因子的不同水平输入A miscellany<-data.frame(x,A) #建立数据集miscellany aov.mis<-aov(x~A,data=miscellany) #方差分析 summary(aov.mis) #导出方差分析表

plot(miscellany$x~miscellany$A) #作出不同水平的比较图

pairwise.t.test(x,A,p.adjust.method=\ #多重t-检验,第一类错误不调整,调整的话,可以用默认的holm,或bonferroni等

方差齐性检验-levene检验 library(car)

leveneTest(x,A) #检验方差是否齐性,即各变量方差是否一致

B) 双因子方差分析

I) 无交互作用的方差分析

因素B10.05A1A20.08A30.11A40.11A:四种检测方法果汁含铅比测试B2B3B40.460.120.380.40.430.050.440.08B:6种不同果汁B50.160.10.10.030.840.920.940.93B61.31.571.11.15

II)

juice<-data.frame(

X=c(0.05,0.46,0.12,0.16,0.84,1.30,0.08,0.38,0.40,0.10,0.92,1.57,0.11,0.43,0.05,0.10,0.94,1.10,0.11,0.44,0.08,0.03,0.93,1.15), A=gl(4,6), B=gl(6,1,24)

) #其中gl(4,6)是设因子函数,4表示4个水平,6表示重复次数,gl(6,1,24)是设因子函数,6表示6个水平,1表示重复次数,24表示结果的长度

juice.aov<-aov(X~A+B,data=juice) #无交互作用的双因素方差分析 summary(juice.aov) #提取方差分析表

有交互作用的方差分析

老鼠存活时间(年)的实验报告因素IIIIII0.310.430.380.440.220.23AB########0.430.82########0.760.45########0.230.92########0.400.56########0.230.30########0.220.30CD########################################################################A、B、C、D为四种治疗方案,I、II、III为三种毒药

rats<-data.frame(

Time=c(0.31,0.45, 0.43,0.45, 0.46,0.43, 0.63,0.76,0.82,1.10, 0.45,0.71,0.88,0.72, 0.66,0.62, 0.38,0.29, 0.44,0.35,0.40,0.23, 0.31,0.40,0.92,0.61, 0.56,1.02, 0.49,1.24, 0.71,0.38, 0.22,0.21,

0.23,0.25, 0.18,0.23, 0.24,0.22,0.30,0.37,0.30,0.36, 0.38,0.29,0.31,0.33), Toxicant=gl(3,16,48,labels=c(\Cure=gl(4,4,48,labels=c(\)

op<-par(mfrow=c(1,2)) #画图区域分为两块

plot(Time~Toxicant+Cure,data=rats) #作毒药和治疗方案各自的效应分析

with(rats,interaction.plot(Toxicant,Cure,Time,trace.label=\#治疗方案的交互效应图

with(rats,interaction.plot(Cure, Toxicant,Time,trace.label=\ #毒药的交互效应图

rats.aov<-aov(Time~Toxicant*Cure,data=rats) #有交互作用的双因素方差分析

summary(rats.aov) #提取方差分析表

相关性检验

新生儿脐带血促甲状腺激素(TSH)水平是评价人群碘营养状况的重要指标,国际卫生组织明确新生儿全血TSH<=5mU/L者为碘营养状况正常

10名孕妇的15-17周及分娩时脐带血TSH(mU/L)母血X1.21####1.39####4.201.424.83####1.56####4.931.684.32####1.98####4.70######## 脐带血Y3.90x<-c(1.21,1.30,1.39,1.42,1.47,1.56,1.68,1.72,1.98,2.10) #母血TSH值 y<-c(3.90,4.50,4.20,4.83,4.16,4.93,4.32,4.99,4.70,5.20) #脐带血TSH值 level<-data.frame(x,y) #产生数据集 plot(level) #画散点图

cor.test(x,y) #相关系数检验

一元线性回归


R语言学习详解(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:大教学论读后感

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: