数据挖掘学习笔记(概述)

来源:互联网 发布:visual foxpro和sql 编辑:程序博客网 时间:2024/04/29 15:21

一、什么是数据挖掘

1.定义:数据挖掘就是从大量数据中找出感兴趣的资料

2.历史:

(1)20世纪60年代,数据库技术开始发展起来,出现一一些数据库系统,数据量也开始增大,有的科学家开始对大量的数据进行分析。

(2)70年代,关系数据库的出现,引起了数据挖掘的热点。

(3)近30年来,随着数据库技术和信息技术的发展,各行业的管理系统开始开发和调试出来,管理系统开始普及。随之产生了大量的可用数据。最重要的就是web2.0的出现,使互联网中充满了大量的信息。为了有效的利用互联网的资源,数据挖掘变得越来越重要。

二、数据挖掘的功能分类

1.描述:得到数据的特性

2.预测:对当前数据进行推论,预测未来趋势

三、数据挖掘的对象

1.关系数据库(DBMS)

2.数据仓库:多维数据立方体

3.数据流

4.时间数据库、序列数据库、时间序列数据库

5.web数据库:万维网

6.信息系统:各领域中的管理系统

四、数据挖掘的模式类型

1.特性化和区分

2.关联和相关

3.分类和预测

4.聚类分析

5.离群点分析

6.演变分析

7.有趣模式的评价

五、数据挖掘的步骤

1.数据清理

2.数据集成

3.数据选择

4.数据变换

5.数据挖掘

6.模式评估

7.知识表达:数据的可视化


0 0
原创粉丝点击