R语言基础

来源:互联网 发布:nginx 模型 编辑:程序博客网 时间:2024/04/27 15:48

1、含义:

R涉及两个含义,既表示一种用于数据分析建模以及绘图的语言,又指一个有着统计分析功能及强大作图功能的软件系统。

2、命令脚本文件:把需要批量执行的命令写入一个脚本文件,然后使用source命令批量执行其内部命令。

3、工作空间数据:

运行R时,所有变量、数据、函数及结果都是以对象(object)的形式存在于计算机的活动内存中,此时内存中的所有对象数据成为称为工作空间数据。可以用save.image()函数把工作空间数据转存于硬盘中。

一般在处理大数据挖掘项目时,前期的数据处理最为耗时。此时通常会把项目中有关数据处理的命令单独制成脚本文件(可命名为:init.data.r),并在脚本文件的最后使用save.image()语句把数据存于硬盘中。

在后续的分析脚本(可命名为:sol.data.r)中,可使用load函数先载入数据处理脚本产生的对象数据。这样在修整分析脚本时,就不必再在数据处理阶段耗费时间了。

4、R语言入门:

R语言语法简单,操作方便,是一种解释型语言,而不是编译语言,也就是说,输入的命令能直接执行。在运行R时,所有变量、数据、函数及结果都会以对象的形式存在于计算机的活动内存中,通过使用运算符和函数即可操作这些对象。

所有可用的R函数都存放在一个库(library)中,该库位于R软件的安装目录/library目录下。其中,base包是R的核心包,直接嵌于R软件安装包中,包含了数据读写、操作最基本的函数。

5、扩展算法包:R软件本身只包含8个基本模块,使用其他函数(如数据分析、文件处理、图形绘制等相关函数)均要通过安装扩展算法包来完成

(1)安装包,使用install.packages()可以在命令行模式下安装包,具体步骤如下:

在命令行中输入安装包命令:如:install.packages("qcc")

选择CRAN镜像站点下载qcc包

R软件下载并安装qcc包

(2)加载包:使用library()或者require()可以将已经安装好的包加载至工作空间内

6、R语言的数据类型:

(1)数据类型可以分为静态类型和动态类型。

在编译期间就确定数据类型的语言,叫静态类型语言,该类语言要求在使用任一变量之前必须声明其数据类型。如java和c就是静态类型语言。

在运行期间才确定的数据类型的语言,叫做动态类型语言。对于该类语言,不必先声明其数据类型,而是通过第一次的赋值来定义其数据类型。R和Python为动态类型语言。

(2)从不同数据类型是否可混合使用的角度来区分,语言又可以分为弱类型语言和强类型语言。

在弱类型语言中,不同数据类型间的数据 可以混合使用。

在强类型语言中相反,不同数据类型间的数据不可以混合使用,必须通过类型转化函数处理后才可以。R和Python是强类型语言。


R支持的数据类型有:数值型、字符型、复数型和逻辑型。

(1)数值类型的取值是实数。如:a <-9.111 mode(a)

(2)复数类型的取值可以扩展到虚数,并使用 <实部数值> + i + <虚部数值>来表示,如:a <- 100 + 11i   mode(a)

(3)逻辑类型的取值为TRUE(T)和FALSE(F),如:a<- T  mode(a)

(4)字符类型取值是字符串,在R语言中,字符串需要使用英文双引号括起来表示。

注意:有两种情况不能使用上述4种数据类型来描述:数据的缺失和数据的未知状态

NA表示数据集中的某数据缺失。在对具有NA样本的变量进行函数操作时,该NA不会被直接剔除

NULL表示未知的状态,在对具有NULL样本的变量进行函数操作时,NULL样本不会被计算,而是用print函数输出变量时也把NULL忽略了,最能说明NULL和NA不同的时当读取向量的长度时,NULL并不占据任何工作空间,而NA时占据内存空间的。

7、对象及其属性

R语言常用对象类型有:向量(vector)、数组(array)、矩阵(matrix)、数据框(data frame)、列表(list)等。其中,数据框和列表的内部元素可以使用不同的数据类型。

注意:数据类型和对象类型的不同之处

对象类型是R语言组织和管理内部元素的不同方式。数据类型则描述了一个变量内元素取值的类型。

(1)固有属性:模式和长度

使用mode函数可以读取对象的模式(数据类型),使用as.<数据类型>可以改变对象的模式。

使用length函数可以读取对象的长度属性。

(2)读取和设置属性值,可以使用attributes()和attr()函数来查看出length和mode外的其他属性

(3)对象的搜索和删除,所有对象均存储在工作空间中,而工作空间又是由计算机内存承载的,因此,一旦对象过于庞大,就往往会影响R软件的运行速度。此时需要查看工作空间内现存的对象列表,并删除其中的某个对象。

0 0
原创粉丝点击