R命令(6)

2019-08-03 13:06

tolower(x) toupper(x)

casefold(x,upper = FALSE)

For (iin 1:10)

日期格式与整数的转换:假设x是日期格式,y是数值 y=as.numeric(x) //将日期x转为数值y class(y)='Date' //将数值y转为日期

Rhadoop:

先安装hadoop,然后在R设置HADOOP_CMD,HADOOP_STREAMING环境,安装rhdfs和rmr2包,缺什么依赖包就安装什么依赖包(尽量不要在RStduio下安装)

keyval(key,val)//创建的pair,常作为map,reduce,to.dfs,from.dfs的参数,返回一个list对象,强制转化为as.data.frame后会循环key或者val

to.dfs(kv,output = dfs.tempfile(), format = \上传pair到hdfs

from.dfs(input,format = \读取hdfs的pair,eg:from.dfs(to.dfs(1:10)) hdfs.ls('/usr/local/hadoop')//查看hdfs文件

mapreduce(input,output=NULL,map,reduce)//input是hdfs上的路径,ouput为NULL时返回一个big.data.object(可以理解为一个hdfs上的临时文件可供其它函数使用),map接收形式的multi-pair执行map操作,返回NULL或者pair。reduce接收multi-pair执行reduce操作,返回NULL或pair.

word(string,start=1,end=start,sep=\字符串提取函数(包stringr中),string是原始字符串,start表示以sep分割的第start个串开始,end表示以sep分割的第end个串结束,比如word(\返回world##c++,sep可以是个字符串(这点比boost库split都优秀啊)

rmr.options(backend= 'hadoop')//使用rmr的hadoop格式,hadoop是默认设置。

merge函数用于合并两个数据框类似于sql中的join

merge(x,y, by = intersect(names(x), names(y)),by.x= by, by.y = by, all = FALSE, all.x = all, all.y =

all,sort = TRUE,suffixes = c(\默认是合并x和y相同名字的列,

26

可以通过by.x和by.y指定x和y按哪列合并。all是逻辑参数为T表示内连接(即x和y指定的列完全相同才可以连接),all.x表示做链接,all.y表示右链接。如:

merge(x,y,by.x=1,by.y=2,all.y=T)//按照x的第一列和y的第二列为关键字合并数据框,并且保留y的所有行,x缺失的用NA代替(rightjoin)

27


R命令(6).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:最新小学沪教版数学四年级下册公开课教学设计四则运算(二)

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: