大数据环境下集成R语言的数据挖掘系统 之 数据分析
来源:互联网 发布:淘宝质量问题如何投诉 编辑:程序博客网 时间:2024/04/29 17:27
这一篇主要介绍数据分析模块实现的算法。
分类模块
流程图
功能
本模块实现了数据分类功能,系统提供了SVM,KNN,决策树,随机森林等分类算法。首先通过对测试集的数据进行模型构建,在构建模型过程中我们可以对模型进行参数设置,模型构建完成之后,我们对预测集进行预测,最后将分类的结果导出。
实现原理
聚类模块
流程图
功能
本模块实现了数据聚类功能,系统提供了kmeans,clara,PAM,Agnes,Diana算法。针对不同的算法,用户需要设置不同的参数,然后系统根据用户设定的参数进行数据聚类,聚类结果将以图和表的形式给用户显示出来。
实现原理
时间序列
流程图
功能
本模块实现了对时间序列数据分析的功能,用户上传时间序列数据,然后设置时间序列参数,通过显示出来的时间序列,我们判断它是否满足相加模型,如果数据满足相加模型我们就不进行处理,否则我们对数据进行相应的处理,使得数据满足相加模型,当数据满足相加模型之后我们对数据进行时间序列建模,我们可以选择自动分析和手动分析,自动分析时系统会根据数据自行设定arima模型的参数,进行相应的分析,手动分析将由用户自己对模型的参数进行设定,模型建立后我们还可以对模型进行评估,看模型是否是最优模型,能否满足用户的需求,最后用户利用模型进行预测。
实现原理
关联规则挖掘
流程图
功能
上传事务型或记录型数据集作为数据源。系统提供了Apriori算法进行关联规则的分析。Apriori算法是最有影响的挖掘布尔关联规则频繁项集的算法,其核心是基于两阶段频集思想的递推算法。
原理
0 0
- 大数据环境下集成R语言的数据挖掘系统 之 数据分析
- 大数据环境下集成R语言的数据挖掘平台 之介绍、数据上传与数据预处理
- 3.17 大数据环境下集成R语言的数据挖掘平台项目记录(一)
- 3.17 大数据环境下集成R语言的数据挖掘平台项目记录(二)
- 大数据环境下集成R语言的数据挖掘平台项目记录(三)
- 大数据环境下基于R语言的数据挖掘平台 之 环境配置
- 大数据环境下基于R语言的数据挖掘平台 之 大数据处理与导出模块
- 谈时代下的大数据分析与挖掘系统
- R语言数据挖掘
- 十大数据挖掘算法的R语言实现
- 【R语言与数据挖掘】-回归分析
- 【大数据部落】用R语言挖掘Twitter数据
- R语言之数据挖掘篇
- R语言之数据挖掘包
- R语言数据挖掘之关联规则
- R语言 数据集成
- 数据挖掘与R语言,数据分析,机器学习
- R语言数据挖掘(1) 探索性数据分析
- 算法与数据结构八日谈之五——数学相关
- leetcode Minimum Depth of Binary Tree
- Ipython
- 面试题准备(01)-反转句子中单词的顺序
- Java 位操作
- 大数据环境下集成R语言的数据挖掘系统 之 数据分析
- H264中的SPS、PPS提取与作用
- hdoj 3440 House Man 【差分约束】 【经典建模】
- Fragment的简单使用
- 时区间时间的转换
- iOS后台网络任务
- 精英意志(一)
- 如何在windows下的Python开发工具IDLE里安装其他模块?
- H264码流结构