为什么要学习R?

来源:互联网 发布:竞彩预测软件 编辑:程序博客网 时间:2024/05/24 02:52

首先讲一个老故事,《啤酒与尿布》



在90年代的美国沃尔玛超市中,超市管理人员在分析销售数据时发现了一个有趣的现象:“啤酒”与“尿布”会经常出现在同一张购物清单里。也就是说买啤酒的人同时也喜欢买尿布。啥?啤酒?尿布?这两个东西能有啥联系?人类的直觉认为他们不存在任何关系,但数据挖掘后的确发现两者存在强相关。所以,这个现象引起了管理人员的注意,经过后续的调查以及数据分析,发现这种情况主要出现在年轻的父亲身上,年龄为30--40岁,购买时间集中在星期五晚上5点--7点之间。基于这样一种关联,沃尔玛决定把啤酒和尿布放在一块儿出售,随后奇妙的事情就发生了:啤酒与尿布的销售额立即增加了35%!


我们也许会问:为什么?刚好,人类喜欢并且擅长通过一些肤浅的表象去分析内在的深刻机理,理由可能如下:


在美国年轻的家庭中,对于刚刚怀孕过的母亲来讲,一大包的尿布分量太重。因此,一般是母亲在家中照看婴儿,由年轻的父亲去超市买尿布。周五下班时间,也是周末的开始,应该喝点小酒放松一下,所以在买尿布的时候就顺手带上了啤酒。


各个领域都进入了大数据时代,数据挖掘本身就可以产生无穷的价值。我们首先来看一下 R 能做什么,下面这个图片是我从R官网中的   task views (https://cran.r-project.org) 里面截取下来的,各位可以看一下:




当时第一次看到的时候就被震撼到了,居然什么都可以做!就算穷其一生也无法把R完全学会。言归正传,各位可以参照 task views , 找到自己的领域或者自己当前的项目,点进去浏览将会是一个不错的开始。


有人会问,就数据分析而言,目前市场有许多软件,比如SPSS,SAS,Excel, Stata, Minitab等,那为什么要学习R?  理由如下:


  1. 无与伦比的作图能力!(个人认为是天下第一,本人就是因为在一篇文献上看到一张图,深深的被吸引,然后果断抛弃了SPSS)。


  2. 完全免费!(当然我们使用SPSS等其他软件也是免费的,国情你懂得。在国外有些软件可能要花费上千美元,这对于学生以及早期教师来说都是一笔不小的负担)。


  3. 强大的数理统计能力! (许多统计学家都是R的忠实粉丝,所以给R提供了最为强大的统计社区,他们会开发最前沿的package给全世界共享,我们可以即时获得,每一个package都是作者本人来维护,我们有什么不懂的地方可以直接email过去询问,他们都乐于帮助,因为每个人都希望自己的东西被大家认同和使用,同时被引用 。其他商业化的软件可能需要等一年甚至几年才能更新到它们的模块里面)


  4. 可以将各种格式的data导入到R里面,包括excel, csv, spss等,也可以直接在网站上直接获取数据。


  5. 可以在多种操作系统上运行,如Windows, Linux, Mac,甚至有人在iphone上安装R。 


当然也有它的缺点:

  1.  学习曲线很陡峭,说白了就是学的很慢啊,但过了那个瓶颈之后会感觉全身舒畅,柳暗花明。(这个公众号的目的也在于帮助大家轻松的学习R,降低学习成本)


今天到此结束,下一篇文章是关于R的安装以及简单介绍R的语法。


同时可以关注我的公众号,LearningR(可扫文章底部的二维码),谢谢!


Have fun !

JAY



原创粉丝点击