数据科学和机器学习中使用的最多的20个R语言包

来源:互联网 发布:淘宝密码忘了无法显示 编辑:程序博客网 时间:2024/05/17 05:07

We list out the top 20 popular Machine Learning R packages by analysing the most downloaded R packages from Jan-May 2015.

我们通过分析从2015年1月至5月下载次数最多的R包,列出了前20名流行的机器学习R


Most of these R packages are favorites of Kagglers, endorsed by many authors, rated based on one package's dependency on other packages. They are also rated & reviewed by users as a crowdsourced solution by Crantastic.org. However, these user ratings are too few to be based on for analysis. 

大多数R包都深受Kagglers大神的最爱,也被资深的笔者所赞美,而这些包的使用率或评价高低不仅仅取决于其它的包对于这个

这个包的依赖程度。还也取决于Crantastic.org并使用其众包能解决方案的用户。但是,用户评价太低以至于不能基于分析来做决定。

Let us explore how many machine learning packages are being downloaded from Jan to May by analysing CRAN daily downloads. 
我们根据从一月到五月的下载量,通过分析CRAN的日均下载量来统计有多少关于机器学习的包被下载了。

1. e1071    Functions for latent class analysis, short time Fourier transform, fuzzy clustering, support vector machines, shortest path computation, bagged clustering, naive Bayes classifier etc (142479 downloads) 

1. 潜类分析函数,短暂性的傅里叶变化、模糊的集群、支持向量机、最短路径计算、装袋集群、朴素贝叶斯分类器等(下载量:142470)。
2. rpart    Recursive Partitioning and Regression Trees. (135390)

2.递归分割和回归树(下载量:135390)。
3. igraph A collection of network analysis tools. (122930)

 3. 网络分析工具的集合(下载量:122930)
nnet Feed-forward Neural Networks and Multinomial Log-Linear Models. (108298)

4. 前馈神经网络和多元对数线性模型(下载量:108298)。
5. randomForest 
Breiman and Cutler's random forests for classification and regression. (105375)

5.Breiman and Cutler’s的关于分类和回归的随机森林(下载量:105375)。

6. caretpackage (short for Classification And REgression Training) is a set of functions that attempt tostreamline the process for creating predictive models. (87151)

6. 一套试图简化创建预测模型的函数集(下载量:87151)。
7. kernlabKernel-based Machine Learning Lab. (62064)

 7. 基于内核的机器学习实验室(下载量:62064)。
8. glmnet Lasso and elastic-net regularized generalized linear models. (56948)

8. Lasso和弹性网正规化广义线性模型(下载量:56948)。
9. ROCR Visualizing the performance of scoring classifiers. (51323)

9.可视评分分类的操作(下载量:51323)。
10. gbmGeneralized Boosted Regression Models. (44760)

10.产生改良的回归模型(下载量:44670)。

11. .partyA Laboratory for Recursive Partitioning. (43290)

11. 一个递归分割实验室(下载量:43290)。
12. arules Mining Association Rules and Frequent Itemsets. (39654)

12. 关联规则挖掘和频繁项集(下载量:39654)。
13.  tree Classification and regression trees. (27882)

13. 分类和回归树(下载量:27882)。
14. klaR      Classification and visualization. (27828)

14.分类和可视化操作(下载量:27828)。
15 . RWeka R/Weka interface. (26973)

15. 关于R或Weka的接口(下载量:26973)。
16.  ipredImproved Predictors. (22358)

16.改良的预测变量(下载量:22358)
17. lars       Least Angle Regression, Lasso and Forward Stagewise. (19691)

17. 最小回归角、Lasso和逐步回归分析阶段(下载量:19691)。
18. earthMultivariate Adaptive Regression Spline Models. (15901)

18. 多元自适应回归样条分析。(下载量:15901)。
19. CORElearn Classification, regression, feature evaluation and ordinal evaluation. (13856)

19. 分类、回归、功能评估和有序评估(下载量:13856)。
20. mboost      Model-Based Boosting. (13078)

20.基于模型的Booting(下载量:13078)。


It is interesting to note that some open source R tools are gaining popularity such as Rattle, a GUI for data mining using R (35539 downloads), and fastcluster, fast hierarchical clustering routines for R and Python (14214 downloads). 
你会发现记住这些越来越受人追捧的开源R工具如Rattle,R的一种图形用户界面的数据挖掘工具(下载量:35539),以及fastcluster,R和Python(下载量:14214)的快速的分级聚类程序。

Did we miss your favorites? Light up this space and contribute to the community by letting us know which R packages you use!! 
难道我们错过了您的最喜欢的R包了吗?点亮这个空间,并让我们知道您使用的R来回馈社会!


查看原文


原文链接:http://blog.csdn.net/wzgl__wh/article/details/51417070


2 0
原创粉丝点击