数据挖掘学习笔记(概述)
来源:互联网 发布:visual foxpro和sql 编辑:程序博客网 时间:2024/04/29 15:21
一、什么是数据挖掘
1.定义:数据挖掘就是从大量数据中找出感兴趣的资料
2.历史:
(1)20世纪60年代,数据库技术开始发展起来,出现一一些数据库系统,数据量也开始增大,有的科学家开始对大量的数据进行分析。
(2)70年代,关系数据库的出现,引起了数据挖掘的热点。
(3)近30年来,随着数据库技术和信息技术的发展,各行业的管理系统开始开发和调试出来,管理系统开始普及。随之产生了大量的可用数据。最重要的就是web2.0的出现,使互联网中充满了大量的信息。为了有效的利用互联网的资源,数据挖掘变得越来越重要。
二、数据挖掘的功能分类
1.描述:得到数据的特性
2.预测:对当前数据进行推论,预测未来趋势
三、数据挖掘的对象
1.关系数据库(DBMS)
2.数据仓库:多维数据立方体
3.数据流
4.时间数据库、序列数据库、时间序列数据库
5.web数据库:万维网
6.信息系统:各领域中的管理系统
四、数据挖掘的模式类型
1.特性化和区分
2.关联和相关
3.分类和预测
4.聚类分析
5.离群点分析
6.演变分析
7.有趣模式的评价
五、数据挖掘的步骤
1.数据清理
2.数据集成
3.数据选择
4.数据变换
5.数据挖掘
6.模式评估
7.知识表达:数据的可视化
0 0
- 数据挖掘学习笔记(概述)
- 数据挖掘(学习笔记)-初识数据挖掘
- 数据挖掘概述(又)
- web数据挖掘(学习笔记)-观点挖掘
- 数据挖掘系列笔记(1):概述
- 电子商务复习笔记六:数据挖掘概述
- 数据挖掘学习笔记(一)
- 数据挖掘学习笔记(一)引论
- 数据挖掘学习笔记(一)
- 数据挖掘学习笔记(二)
- 数据挖掘学习笔记(三)
- 数据挖掘学习笔记-分类(1)
- 《数据挖掘导论》学习笔记(一)
- 《数据挖掘导论》学习笔记(二)
- 数据挖掘学习笔记(1)
- 数据挖掘学习笔记(2)
- 数据挖掘学习笔记(3)
- 数据挖掘学习笔记(4)
- 关于产品的一些思考——八千里网络之谁叫我起床
- 最短路径—Dijkstra算法和Floyd算法
- raspberry pi 有线上网设置
- 逻辑地址、线性地址、物理地址和虚拟地址理解 .
- C++ const引用,指针,constexpr
- 数据挖掘学习笔记(概述)
- 类中的一些知识点
- cookie的相关操作
- web.xml加载顺序
- poj 1007 DNA Sorting
- 戴尔笔记本win8.1+UEFI下安装Ubuntu14.04过程记录
- JS--XML 操作
- Light OJ 1116 Ekka Dokka(数学,二进制的应用)
- myeclipse2014下载地址