浅谈R语言

来源:互联网 发布:气象数据下载 编辑:程序博客网 时间:2024/04/29 16:27

      在大数据时代下,随之引起了数据挖掘,数据分析,机器学习等的迅速发展。于此同时,也让人们越来越注意到R语言功能的强大。在此之前,R语言几乎只是一些统计学家们再用。R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。在大数据的发展和推动下,人们渐渐开始发现了R语言的优点,并开始重视起R语言。

R语言的特点 大概有一些这么几点:


(1) 有效的数据处理和保存机制。 


(2) 拥有一整套数组和矩阵的操作运算符。 


(3) 一系列连贯而又完整的数据分析中间工具。 


(4) 图形统计可以对数据直接进行分析和显示,可用于多种图形设备,R语言强大的绘图功能,制图具有印刷的素质,也可加入数学符号。 


(5) 一种相当完善、简洁和高效的程序设计语言。它包括条件语句、循环语句、用户自定义的递归函数以及输入输出接口。 


(6) R语言是彻底面向对象的统计编程语言。 


(7) R语言和其它编程语言、数据库之间有很好的接口。 最近Oracle数据库开始正式支持R语言。


(8) R语言是自由软件,可以放心大胆地使用,但其功能不会输给SPAA,SAS,MATLAB等专业软件。


(9) R语言具有丰富的网上资源,各种数据包都可以在R语言官网下载使用,当然,如果R语言已有的数据包无法满足自己的需求,自己也可以写出相关的包来使用。 


(10)R是一个无与伦比的平台,在其上可使用一种简单而直接的方式编写新的统计方法。它易于扩展,并为快速编程实现新方法提供了一套十分自然的语言。

    

(11)跨平台也是R语言的另一个优势。R的源代码可自由下载使用,GNU通用公共许可证,可在多种平台下运行,包括UNIX,Linux,Windows和MacOS。


 这些都是R语言的优点。但其实在2011年前,R语言在国内的发展依旧不温不火。而然 到了2011,大数据突然火了,R语言就开始快速发展一举杀进编程语言排行榜前20名。然而就在就在之前R语言从未进入过前20.由此可见R语言发展的有多么迅猛。



   每当谈到大数据,几乎每一个人都会想到Hadoop。Hadoop就是大数据代名词。但在现在,R语言已经与Hadoop开始结合起来使用。其中Hadoop主要用来存储海量数据,而R语言则完成MapReduce算法,有了R语言与Hadoop结合而成的强大工具RHadoop  (RHadoop是一款Hadoop和R语言的结合的产品,由RevolutionAnalytics公司开发,并将代码开源到github社区上面。RHadoop包含三个R包 (rmr,rhdfs,rhbase),分别是对应Hadoop系统架构中的,MapReduce, HDFS, HBase 三个部分),这才使得广大R语言爱好者甚至可以处理PB级大数据,也解决了大数据带来的单机性能问题,在加上Oracle数据库开始正式支持R语言,R语音肯定越来越被重视,应用也会越来越广泛。

在刚开始学习R语言时,你会发现它的语法非常简单灵活,这有程序员来说是件好事,但也存在许多弊端,肯定也会出许多错误,这就需要我们认真仔细。R语言虽然是彻底面向对象的统计编程语言,但它并不像Java,c++那样,R语言也是一门基于向量的语言,可以把向量想象成一行或一列的数字或文本,比如{1,2,3,4,5}就是一个向量。R语言允许你再一次操作中对整个向量进行函数运算,而无需借助其他语言的循环,数组等麻烦的过程。比如下面这一段代码(在R语言中#后面可以写注释,就好比Java和C++中的//  或/*    */)


比如小孩的体重和年龄的关系(数据随便写的,不必太当真吐舌头


画出来的图如下


这是一个特别简单的图。还可以打印出其他图比如以下这些


在我看来,R语言有很好的发展空间和极好的发展机遇,在未来,肯定也会需要更多的R程序员。好了,今天就先写这,以后再与大家分享交流。

R软件下载地址点击打开链接
给大家推荐两个关于R语言的网站,仅供学习交流。

https://www.kaggle.com/

https://github.com/

2 0
原创粉丝点击