R语言基础
来源:互联网 发布:nginx 模型 编辑:程序博客网 时间:2024/04/27 15:48
1、含义:
R涉及两个含义,既表示一种用于数据分析建模以及绘图的语言,又指一个有着统计分析功能及强大作图功能的软件系统。
2、命令脚本文件:把需要批量执行的命令写入一个脚本文件,然后使用source命令批量执行其内部命令。
3、工作空间数据:
运行R时,所有变量、数据、函数及结果都是以对象(object)的形式存在于计算机的活动内存中,此时内存中的所有对象数据成为称为工作空间数据。可以用save.image()函数把工作空间数据转存于硬盘中。
一般在处理大数据挖掘项目时,前期的数据处理最为耗时。此时通常会把项目中有关数据处理的命令单独制成脚本文件(可命名为:init.data.r),并在脚本文件的最后使用save.image()语句把数据存于硬盘中。
在后续的分析脚本(可命名为:sol.data.r)中,可使用load函数先载入数据处理脚本产生的对象数据。这样在修整分析脚本时,就不必再在数据处理阶段耗费时间了。
4、R语言入门:
R语言语法简单,操作方便,是一种解释型语言,而不是编译语言,也就是说,输入的命令能直接执行。在运行R时,所有变量、数据、函数及结果都会以对象的形式存在于计算机的活动内存中,通过使用运算符和函数即可操作这些对象。
所有可用的R函数都存放在一个库(library)中,该库位于R软件的安装目录/library目录下。其中,base包是R的核心包,直接嵌于R软件安装包中,包含了数据读写、操作最基本的函数。
5、扩展算法包:R软件本身只包含8个基本模块,使用其他函数(如数据分析、文件处理、图形绘制等相关函数)均要通过安装扩展算法包来完成
(1)安装包,使用install.packages()可以在命令行模式下安装包,具体步骤如下:
在命令行中输入安装包命令:如:install.packages("qcc")
选择CRAN镜像站点下载qcc包
R软件下载并安装qcc包
(2)加载包:使用library()或者require()可以将已经安装好的包加载至工作空间内
6、R语言的数据类型:
(1)数据类型可以分为静态类型和动态类型。
在编译期间就确定数据类型的语言,叫静态类型语言,该类语言要求在使用任一变量之前必须声明其数据类型。如java和c就是静态类型语言。
在运行期间才确定的数据类型的语言,叫做动态类型语言。对于该类语言,不必先声明其数据类型,而是通过第一次的赋值来定义其数据类型。R和Python为动态类型语言。
(2)从不同数据类型是否可混合使用的角度来区分,语言又可以分为弱类型语言和强类型语言。
在弱类型语言中,不同数据类型间的数据 可以混合使用。
在强类型语言中相反,不同数据类型间的数据不可以混合使用,必须通过类型转化函数处理后才可以。R和Python是强类型语言。
R支持的数据类型有:数值型、字符型、复数型和逻辑型。
(1)数值类型的取值是实数。如:a <-9.111 mode(a)
(2)复数类型的取值可以扩展到虚数,并使用 <实部数值> + i + <虚部数值>来表示,如:a <- 100 + 11i mode(a)
(3)逻辑类型的取值为TRUE(T)和FALSE(F),如:a<- T mode(a)
(4)字符类型取值是字符串,在R语言中,字符串需要使用英文双引号括起来表示。
注意:有两种情况不能使用上述4种数据类型来描述:数据的缺失和数据的未知状态
NA表示数据集中的某数据缺失。在对具有NA样本的变量进行函数操作时,该NA不会被直接剔除
NULL表示未知的状态,在对具有NULL样本的变量进行函数操作时,NULL样本不会被计算,而是用print函数输出变量时也把NULL忽略了,最能说明NULL和NA不同的时当读取向量的长度时,NULL并不占据任何工作空间,而NA时占据内存空间的。
7、对象及其属性
R语言常用对象类型有:向量(vector)、数组(array)、矩阵(matrix)、数据框(data frame)、列表(list)等。其中,数据框和列表的内部元素可以使用不同的数据类型。
注意:数据类型和对象类型的不同之处
对象类型是R语言组织和管理内部元素的不同方式。数据类型则描述了一个变量内元素取值的类型。
(1)固有属性:模式和长度
使用mode函数可以读取对象的模式(数据类型),使用as.<数据类型>可以改变对象的模式。
使用length函数可以读取对象的长度属性。
(2)读取和设置属性值,可以使用attributes()和attr()函数来查看出length和mode外的其他属性
(3)对象的搜索和删除,所有对象均存储在工作空间中,而工作空间又是由计算机内存承载的,因此,一旦对象过于庞大,就往往会影响R软件的运行速度。此时需要查看工作空间内现存的对象列表,并删除其中的某个对象。
- R语言基础-向量
- R语言基础入门
- R语言编程基础
- R语言基础画图
- R语言基础应用
- R语言基础:向量
- R语言基础-01
- R语言基础-02
- R语言基础-03
- R语言基础-04
- R语言-基础操作
- R语言基础语法
- R语言基础
- R语言基础备忘
- R语言基础
- R语言基础总结
- R语言基础
- R语言基础
- 分享sdk
- Windbg 设置成默认调试器
- zoj 3876 May Day Holiday (基姆拉尔森计算公式)
- Department Highest Salary
- 【运维规范】修改Windows 操作系统用户的密码之前,应该做的核查工作
- R语言基础
- 学习ASP .NET MVC5官方教程总结(七)Edit方法和Edit视图详解
- DB_FILE_NAME_CONVERT
- 安卓开发模拟器运行时报错原因以及解决方法
- Doctype and charset : standard of HTML--Head first into HTML
- PagerSlidingTabStrip 标题加图标
- Eclipse出现"错误: 找不到或无法加载主类"的情况
- 主题管家-如何切换不同的主题
- 兔子-- Can not issue data manipulation statements with executeQuery()