常用R包

来源:互联网 发布:mac移动硬盘无法拷贝 编辑:程序博客网 时间:2024/06/05 09:52

Machine Learning 在R中最常用的包

e1071 隐类分析,短时傅立叶变换,模糊聚类,支持向量机,最短路径计算,袋装集群,朴素贝叶斯分类器 等函数(142479 downloads) 
rpart 递归分割和回归树. (135390) 
igraph 网络分析工具集. (122930) 
nnet 前馈神经网络和多项对数线性模型. (108298) 
randomForest 随机森林分类和回归. (105375) 
caret 是一系列试图简化创建预测模型程序的功能. (87151) 
kernlab 基于核的机器学习实验室. (62064) 
glmnet Lasso and elastic-net正则化广义线性模型. (56948) 
ROCR 分类器的性能评分的可视化. (51323) 
gbm 广义Boosted 回归模型. (44760) 
party 一种递归分割实验室. (43290) 
arules 关联规则挖掘和频繁项集. (39654) 
tree 分类和回归树. (27882) 
klaR 分类和可视化. (27828) 
RWeka R/Weka 接口. (26973) 
ipred 改进预测. (22358) 
lars 最小角回归, Lasso 和 逐步向前回归. (19691) 
earth 多元自适应回归样条模型. (15901) 
CORElearn 分类,回归,功能评价和有序评价. (13856) 
mboost 基于模型的Boosting. (13078)

H2o 是R 中深度学习使用最广泛的包.实现了深度前馈神经网络和自动编码器. 
DeepNet 实现深度神经网络,深度信念网络和受限玻尔兹曼机 
mxNet 有预先训练模型,可用于目标识别. 
darch 深度架构 和 受限玻尔兹曼机

devtools twiter 的异常检测

dplyr 对于喜欢处理数据框对象的,无论是在内存和内存不足的快速,一致的工具

caret 试图简化创建预测模型程序

corrplot 相关矩阵,置信区间的图形显示。它也包含了一些做矩阵重新排序的算法。此外,corrplot擅长细节,包括选择颜色,文本标签,彩色标签,布局等。

rms 通过存储回归建模,测试,评估,验证,图形,预测和排版增强模型设计拟合属性。 “RMS”是与协助精简模型功能的集合。它还包含连续Y表示二进制和有序Logistic回归模型的功能,和Buckley-James多元回归模型为右截尾的响应,并实施惩罚logistic 和普通线性模型最大似然估计。 “RMS”与几乎所有的回归模型,处理二进制或有序回归模型,Cox回归工作,加速失效时间模型,一般线性模型,Buckley-James模型,串行或空间相关观测的广义最小二乘,广义线性模型和分位数回归。

网络分析

igraph 简单的图表和网络分析。它可以处理大量的图形,生成非常好的随机和定期图表,图形可视化,核心方法和更多功能。

Hmisc 包含数据分析,高级别的图形,实用的操作,计算样本大小和力量,引进和注释数据集,输入缺失值,先进的表制作,变量聚类,字符串处理函数,R转换latex,和重新编码变量。

开发

hadley/devtools 让R开发更简单

金融 ##

zoo 定期和不定期时间序列的基础架构。

quantmod

自然语言处理

text2vec 向量化和Word嵌入的快速文本挖掘框架

数据库管理

rhdfs 提供连接hdfs 还有rhive 等等

高性能

Rcpp11 Rcpp 重新设计实现,Rcpp 提供强大的API,让R的函数运行更快

并行

SparkR

ddR 提供分布式数据结构和简单的分布式计算

parallel

网络技术和服务

shiny 使得它非常容易建立与R交互式Web应用程序

RCurl

XML

可再现研究

knitr 提供了R中用文学编程技术动态生成报表的通用工具。

图形展示

ggplot2 这个包不用多说了

数据操作

plyr 拆分,应用和数据结合的工具

data.table data.frame的扩展

reshape2 灵活的reshape数据

sqldf 提供对data.frame的sql查询