数据分析的一般过程

来源:互联网 发布:js设置td字体颜色 编辑:程序博客网 时间:2024/04/26 00:29

1.数据预处理
主要包括了重复值处理、缺省值处理、抽样处理、训练集和测试集处理。
2.应用模型
根据要求选择相应的数学模型进行分析。这里主要包括了分类算法,聚类算法,关联分析,回归分析4大类型的模型应用。
3.观察处理结果
在套用相应的数学模型之后会产生相应的处理结果,比如在回归分析中会产生相关系数,而关联分析中则会产生提升度等指标。
4.图形可视化
在R语言中一般使用plot函数来作图,当然还有ggplot包来做出更加精美的图形。
5.预测分析
在R语言中一般使用predict函数来进行数据的预测分析。

0 0
原创粉丝点击