数据挖掘 R VS Python

来源:互联网 发布:大势至usb端口 编辑:程序博客网 时间:2024/04/26 21:05

1、

1.1、Python

编程语言

1.2、R
统计工具
R is not really a programming language.

2、

2.1、全面性,从这点来说,我认为Python的确胜过R。无论是对其他语言的调用,和数据源的连接、读取,对系统的操作,还是正则表达和文字处理,Python

都有着明显优势。毕竟,python本身是作为一门计算机编程语言出现的,而R本身只是源于统计计算。所以从语言的全面性来说,两者差异显著。
综上所述,本人认为,对于本地文件直接的数据分析,大部分时候R是比较Python更好的 
(速度相近,但分析更专业)。如果涉及多方资源的协调(比如远程、数据库、系统、网页),那么最好的方式是将python和R相结合使用。
当然,每种语言有自己的学习曲线。因此学习本身也要多花时间,因此如何选取还要依赖于个人而论。

2.2、从数据分析的角度来说,python主要是结合pig/hive用来做数据的收集清理,R主要是可以用来测试算法和模型。做好后,由Py来封装做data pipeline.


3、



4、其他url

http://bbs.pinggu.org/thread-2627996-1-1.html


0 0
原创粉丝点击