R简单实用总结

来源:互联网 发布:gtaol淘宝刷钱原理 编辑:程序博客网 时间:2024/05/09 19:05

1、下载安装
R可以在其主页https://www.r-project.org/上的R综合资料往(Comprehensive R Archive Network,CRAN)获得
也可安装RStudio http://www.rstudio.org/ ,关于RStudio软件的简单说明见文章http://www.dataguru.cn/article-1602-1.html
2、对包的常用操作
在R语言中,常需要看哪个包加载了或是看多个相似功能的包,看到底是哪个包在起作用,通过加载和卸除后进行运行比较分析。
(1)查看已加载的包
>(.packages())
(2)移除已加载的包
注意,移除与卸载不同,移除只是希望该报不被加载,并没有将包从R的运行环境中彻底删除
>detach(“package:包名”)
(3)安装包
包的下载地址:https://cran.r-project.org/bin/windows/contrib/
此处需要注意与当前安装的R版本是否兼容,查看R版本的一个简单方法是在软件导航栏”help”菜单下的”about”中查看
方法一:使用命令
>install.packages(“包名”)
方法二:在界面直接操作
在软件导航栏的”Packages”菜单下选择“Install package(s)from local zip files……”
(4)卸载已加载包
remove.packages(pkgs, lib)
参数:pkgs
a character vector with the names of the packages to be removed.
要删除的软件包的名称与特征向量。
参数:lib
a character vector giving the library directories to remove the packages from. If missing, defaults to the first element in .libPaths().
给一个字符向量库目录中删除软件包。如果缺少,默认的第一个元素在.libPaths()。
(5)查看已安装的包
注意,加载的包一定是已经安装的包,但是安装的包不一定已经被加载。
>installed.packages() #显示所有信息
>installed.packages()[,c(‘Package’,’Version’,’LibPath’)] #表示显示包名、版本、库路径信息
(6)查看包提供的函数
>help(package=’包名’)
结果在浏览器中显示
(7)查看某个函数的详细说明
>help(函数名)
结果在浏览器中显示
(8)查看工作目录
>getwd() #如果没有提前设置,则默认工作目录为R软件安装路径
(9)设置工作目录
>setwd(路径字符串) #注意:首先要确保设置的工作目录已经存在;另外,R语言采用的是UNIX路径规则,目录层级间隔符使用“/”,也可使用“.”代表当前路径,用“..”代表上级路径,但使用Windows常用的“\”作为目录层级间隔符会出错。
如:>setwd(“d:\My Documents\r”) #错误

>setwd("d:/My Documents")>setwd("./r")>getwd()[1]"d:/My Documents/r"    

(10)批量执行.r文件中的所有命令
>source(“d:/My Documents/script.r”) #批量执行script.r文件中的所有命令
(11)获取变量的数据类型
>a<-18.2
>mode(a) #获得a的数据类型,此处返回结果为“numeric”即实数
a<-“Cherry” #字符类型需要用双引号
mode(a) #返回结果为“character”

R语言数据类型
1、在编译期间就确定数据类型的语言,叫静态类型语言,如C,Java,C#
在运行期间才确定数据类型的语言,叫做动态类型语言。如R,Python。对于该类语言,不必事先声明其数据类型,而是通过第一次的赋值来定义其数据类型。
2、R语言的数据类型为强数据类型,即不同类型数据间不可混合使用。
3、主要的4种数据类型有“numeric”(实数),“complex”(复数),”logical“(逻辑,TRUE简写T,FALSE简写F),“character”(字符)
4、NA表示数据集中的某数据遗失,NULL表示未知的状态。NA占据工作空间,而NULL是不占据任何工作空间的。去掉对象中的NA的影响,通过设置na.rm=T
这里写图片描述
5、可以通过mode(变量名)来获得变量的类型
这里写图片描述
6、可以通过函数as.<数据类型>
这里写图片描述
对象及其属性
R语言内部数据变量、函数结果、产生的图像等都是以对象形式存在。R语言的常用对象类型有向量(vector)、数组(array)、矩阵(matrix)、数据框(data frame)、列表(list)等。其中,对于数据框类型对象,相同列内元素的数据类型必须相同,不同列的数据类型可以不同。对于列表类型对象,任何元素的数据类型均可不同。下图源自《R语言与网站分析》
这里写图片描述
1、属性操作常用函数
(1)列出对象属性
attributes(对象名)
(2)修改对象属性
attr(x,”names”)<-“new_name” #将对象x的属性“names”的值改为”new_name”
(3)列出所有对象
ls()
(4)删除对象
rm(a) #删除对象a
rm(list=ls()) #删除所有对象
2、向量
是以一维数组方式管理的一种数据类型。
(1)向量创建
c(<元素1>,<元素2>,<元素3>…<元素n>)
这里写图片描述
(2)向量索引
a)下标方式索引
注意R语言的下标是从1开始的。
这里写图片描述
b)which方式索引
利用which函数,获得向量中满足条件的元素的下标
这里写图片描述
c)subset方式索引
subset可以方便地索引向量、矩阵及数据框,得到的是元素子集
这里写图片描述
d)match方式索引
称作匹配函数
match(x,table,nomatch=NA,incomparables=NULL)
其中x为查询对象;table为要匹配的元素值,可以是向量形式;nomatch用来设置不匹配的元素返回的值,如果不设置这返回NA;incomparables用来设置table参数中无效的匹配值,默认不设置。
这里写图片描述
e)%in%方式索引
判断对象中是否包含指定的元素值,如果存在返回T,否则返回F
这里写图片描述
(3)向量的其他操作
a)向量扩展
其他说明:
1、红色文本是输入命令,蓝色文本是命令结果的终端展示。
使用sink()命令可将所有后续的命令由终端转向一个外部文件

sink(“d:/My Documents/r/output.txt”) #后续代码的输出写入该txt文件
sink() #把后续代码输出结果重新恢复到终端上
2、R是一种解释型语言,即输入的命令能够直接执行。在运行R时,所有变量、数据、函数及结果都会以对象的形式存在计算机的活动内存中,通过使用运算符和函数即可操作这些对象。
3、R对大小写敏感
4、注释符为“#”

0 0
原创粉丝点击