R的极客理想-中学数学 导数 概率 连续分布-R语言

2019-04-21 18:39

R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大。

R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。

要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,概率,统计知识,同时还要有创新精神,把R语言发挥到各个领域。让我们一起动起来吧,开始R的极客理想。

前言

覆盖R基础知识,快速上手,RHadoop环境的搭建基础课。 目录 1. 2. 3. 4. 5.

背景知识 开发环境 R语法 R基本函数 R的扩展包

1. 背景知识

R起源

R 是一个有着统计分析功能及强大作图功能的软件系统,是由奥克兰大学统计学系的Ross Ihaka和Robert Gentleman 共同创立。由于R 受Becker, Chambers & Wilks 创立的S 和Sussman 的Scheme两种语言的影响,所以R 看起来和S 语言非常相似。

R 是一个世界范围统计工作者共同协作的产物,至2013 年2 月共计近5000 个包可在互联网上自由下载,这些都是各行业数据分析同行的工作结晶。 R的特点 1. 2. 3. 4. 5. 6. 7. 8. 9.

有效的数据处理和保存机制。

拥有一整套数组和矩阵的操作运算符。 一系列连贯而又完整的数据分析中间工具。

图形统计可以对数据直接进行分析和显示,可用于多种图形设备。

一种相当完善、简洁和高效的程序设计语言。它包括条件语句、循环语句、用户自定义的递归函数以及输入输出接口。 R语言是彻底面向对象的统计编程语言。

R语言和其它编程语言、数据库之间有很好的接口。

R语言是自由软件,可以放心大胆地使用,但其功能却不比任何其它同类软件差。 R语言具有丰富的网上资源

R的下载和安装

R是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的,在那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。 R的官方网站: http://www.r-project.org/ Linux Ubuntu的R安装

~ sudo vi /etc/apt/sources.list

deb http://mirror.bjtu.edu.cn/cran/bin/linux/ubuntu precise/

~ sudo apt-get update

~ sudo apt-get install r-base-core=2.15.3-1precise0precise1

2. 开发环境

R命令行环境:

R默认的界面环境:

RStudio的IDE开发环境: http://www.rstudio.com/

3. R语法

R是一种语法非常简单的表达式语言(expression language),大小写敏感。

可以在R 环境下使用的命名字符集依赖于R 所运行的系统和国家(系统的locale 设置),允许数字,字母,“.”,“_” 1). 命名

命名必须以”.”或者字母开头,以”.”开头时第二个字符不允许是数字。

2). 基本命令

基本命令要么是表达式(expressions),要么就是赋值(assignments)。

? ?

表达式,命令将被解析,并将结果显示在屏幕上,同时清空该命令所占内存。 赋值,命令将被解,并把值传给变量,但结果不会自动显示在屏幕上。

命令可以被”;”隔开或者另起一行。基本命令可以通过大括弧{},放在一起构成一个复合表达式。 注释:一行中以井号”#”开头

换行:如果一条命令在一行结束的时候在语法上还不完整,换行提示符,默认是+ 3). 基本的对象

R创建和控制的实体被称为对象。它们可以是变量,数组,字符串,函数,或者其他通过这些实体定义的一般性的结构。

? ? ? ? ?

矩阵(matrix)或者更为一般的数组(array)是多维的广义向量。实际上,它们就是向量,而且可以同时被两个或者更多个索引引用,并且以特有的方式显示出来。 因子(factor)为处理分类数据提供的一种有效方法。

列表(list)是一种泛化(general form)的向量。它没有要求所有元素是同一类型,许多时候它本身就是向量和列表类型。列表为统计计算的结果返回提供了一种便利的方法。

数据框(data frame)是和矩阵类似的一种结构。在数据框中,列可以是不同的对象。可以把数据框看作是一个行表示观测个体并且(可能)同时拥有数值变量和分类变量的`数据矩阵’ 。许多实验数据都可以很好的用数据框描述:处理方式是分类变量而响应值是数值变量。

函数(function)是可以保存在项目工作空间的R 对象。该对象为R 提供了一个简单而又便利的功能扩充方法。见编写你自己的函数

在R会话过程中,对象是通过名字创建和保存的。objects(), ls()可以显示当前会话的对象名字。rm()可以删除对象。 对象持久化

R 会话中创建的所有对象可以永久地保存在一个文件中以便于以后的R 会话调用。在每一次R 会话结束的时候,你可以保存当前所有可用的对象。如果你想这样做,这些对象将会写入当前目录下一个叫.RData的文件中,并且所有在这次会话中用过的命令行都会被保存在.Rhistory 的文件中。当R 再次在同一目录下启动,这些对象将从这个文件中重新导入工作空间。同时,相关的历史命令文件也会被导入。 4). 向量和赋值

向量是由一串有序数值构成的序列

x <- c(10.4, 5.6, 3.1, 6.4, 21.7)

函数c()完成的赋值语句。这里的函数c() 可以有任意多个参数,而它返回的值则是一个把这些参数首尾相连形成的向量。 赋值也可以用函数assign()实现。

assign(\

赋值符<-,->可以看作是该命令一个语义上的缩写。

c(10.4, 5.6, 3.1, 6.4, 21.7) -> x

向量运算

在算术表达式中使用向量将会对该向量的每一个元素都进行同样算术运算。

出现在同一个表达式中的向量最好是长度一致。如果他们的长度不一样,该表达式的值将是一个和其中最长向量等长的向量。 表达式中短的向量会被循环使用以达到最长向量的长度。 对于一个常数就是简单的重复。

v <- 2*x + y + 1

逻辑向量

逻辑向量元素可以被赋予的值,有TRUE,FALSE 和NA 逻辑向量可以由条件式(conditions)产生 temp <- x > 13 字符向量

字符向量就是字符串,可以用双引号和单引号作分割符。

paste():可以把单独的字符连成字符串,可以有任意多的参数。参数中的任何数字都将被显式地强制转换成字符串,而且以同样的方式在终端显示。默认的分隔符是单个的空格符。 修改分隔符换成”“

labs <- paste(c(\


R的极客理想-中学数学 导数 概率 连续分布-R语言.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:煤矿通风机设备安装工程施工组织设计#河南

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: