数据挖掘流程
来源:互联网 发布:做豆浆用什么机器知乎 编辑:程序博客网 时间:2024/05/18 02:42
下面是数据挖掘流程(CRISP-DM跨行业数据挖掘标准流程),这是目前业界主流的数据挖掘流程,其实本人觉得这也是统计学
建模方式的语言模式,大家都是这么做的,只是用个专门的流程会方便一些
1、 业务理解
理解项目的目标和从业务的角度理解需求,同时将这个知识转化为数据挖掘问题的定义和完成目标的初步计划
(1) 确定业务目标
从业务角度全面理解挖掘的真正意图和需求。除此之外还应包括一个对数据挖掘项目结果进行评价的标准以及整个项目预算和理性的解释。输出的结果包括:背景、业务目标、项目成功标准。
(2) 评估环境
对所有的资源、约束、假设和其他应考虑的因素进行详细的分析和评估,以便下一步确定数据分析目标和项目计划。输出结果:资源清单、需求,假设和约束、风险和所有费用、术语表、成本、收益。
(3) 确定数据挖掘的目标
与业务目标不同,数据挖掘目标是从技术的角度描述项目的目的。输出结果:数据挖掘目标、数据挖掘成功标准。
(4) 产生项目计划
计划应列出将要执行的阶段,以及每个阶段的详细计划(包括每个阶段的时间、所需资源、输入、输出和依赖)。输出结果:项目计划、工具和技术的初步评价。
2、 数据理解
3、 数据准备
(1) 数据选择
(2) 数据清洗
(3) 数据构建(通过已有的数据生成新的有用的数据)
(4) 数据集成(合并)
(5) 数据格式化
4、 建立模型
(1) 选择建模技术
(2) 产生测试设计(训练集、测试集)
(3) 建立模型
(4) 评估模型
5、 评价
(1) 评价挖掘结果
(2) 回顾过程
(3) 确定下一步
6、 实施
(1) 实施计划
(2) 监测、维护
(3) 产生最终报告
(4) 回顾项目
- 数据挖掘的流程
- 数据挖掘流程
- 数据挖掘的流程
- 数据挖掘流程
- 数据挖掘标准流程
- 数据挖掘流程
- 数据挖掘-开发流程
- 数据挖掘一般流程
- 大数据挖掘流程
- 跨行业数据挖掘标准流程
- 数据挖掘的标准流程
- 数据挖掘之标准流程
- 跨行业的数据挖掘流程
- sklearn做数据挖掘流程
- 数据挖掘步骤(流程)
- 【数据挖掘】【笔记】阅读之数据挖掘比赛基本流程
- 数据挖掘 NLP 之 文本挖掘 文本处理 通用流程
- 转:数据挖掘流程及主流工具
- BFS (广度优先搜索)
- Context的getCacheDir()、getFilesDir()、getExternalFilesDir()、getExternalCacheDir()的作用
- iOS技术框架构和更新版本的技术特性
- !!使用Caffe对图片进行训练并分类的简单流程
- poj 3177 Redundant Paths (双连通)
- 数据挖掘流程
- 南邮 OJ 1899 树木枝干问题I
- Leetcode_237_Delete Node in a Linked List
- Android 拍照获取源图像
- 性能优化之Java(Android)代码优化
- Java学习笔记四——接口与内部类
- 哈希-4 Values whose Sum is 0
- split 分割 字符串(分隔符如:* ^ : | , .) 及注意点
- 【leetCode】Same Tree