从整体上认识数据挖掘
来源:互联网 发布:centos 下载文件到本地 编辑:程序博客网 时间:2024/04/29 22:30
一、数据挖掘技术的产生:
数据收集和数据存储技术的快速进步,使得积累海量数据已成为家常便饭。然而,提取有用的信息也成为巨大的挑战。通常,由于数据量太大,无法使用传统的数据处理工具和技术处理它。“数据挖掘”技术由此产生,数据挖掘技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合,从而实现处理大量数据的目的。
二、什么是数据挖掘:
数据挖掘是在大型数据存储库中,自动的发现有用信息的过程。数据挖掘技术用来探查大型的数据库,发现先前未知的有用模式。数据挖掘还具有预测未来观测结果的能力。
三、数据挖掘与知识发现:
数据挖掘是数据库中只是发现(konwledge discovery in database,KDD)不可缺少的一部分,而KDD是将未加工的数据转换为有用信息的整个过程,如下图所示:
四、数据挖掘任务:
通常数据挖掘任务分为下面两大类:
1、预测任务。这些任务的目标是根据其他属性的值,预测特定属性的值。被预测的属性一般称为目标变量或因变量,而用来做预测的属性称为说明变量或自变量。
2、描述任务。这里,目标是导出概括数据潜在联系的模式(相关、趋势、聚类、轨迹和异常)。
五、数据挖掘四种主要任务:
1、预测建模:
预测建模就是为某种任务建立模型。有两类预测建模的任务:分类,用于预测离散的目标变量;回归,用于预测连续的目标变量。
2、关联分析:
用来发现描述数据中强关联特征的模式。所发现的模式通常用蕴涵规则或特征子集的形式表示。由于搜索空间是指数规模的,关联分析的目标是以有效的方式提取
有趣的模式。
3、聚类分析:
旨在发现紧密相关的观测值组群,使得与属于不同簇的观测值相比,属于同一簇的观测值之间相互之间尽可能类似。聚类可用来对相关的客户分组、找出显著影响地球气候的海洋区域以及压缩数据等。
4、异常检测:
异常检测的任务是识别其特征显著不同于其他数据的观测值。这样的观测值称为异常点或离群点。异常检测的目标是发现真正的异常点,而避免错误的将正常的对象标注为异常点。
- 从整体上认识数据挖掘
- 数据挖掘读书笔记-认识数据
- 数据挖掘的认识误区
- 数据挖掘的初步认识
- 我认识的数据挖掘
- 数据挖掘笔记-特征选择-整体汇总
- 数据挖掘小白入门-整体思路
- 从WikiPedia挖掘数据
- 从WikiPedia挖掘数据
- 数据挖掘——认识数据
- 【数据挖掘笔记二】认识数据
- 如何从整体架构上学习android
- 互联网上的数据挖掘
- 互联网上的数据挖掘
- 数据挖掘之从数据中学习
- 数据挖掘读书笔记一——数据认识
- 【数据挖掘概念与技术】学习笔记2-认识数据
- 【读书笔记-数据挖掘概念与技术】认识数据
- 自定义view
- YUM 软件包升级器
- springIOC
- cocos2dx中实现Java传值给lua
- 【Eclipse】常用快捷键
- 从整体上认识数据挖掘
- 单词倒置
- 快速排序之java实现
- IDEA添加阿里巴巴Java开发规约插件
- Android网络技术
- DEB 包 (Debian, Ubuntu 以及类似系统)
- SEO核心技术:SEO优化中内容增益好处
- CREATE_FUNC宏定义函数和lambda表达式作为参数
- sql数据库打开报"值不能为空。参数名viewinfo(microsoft.sqlserver.management.sqlstudio.explorer)”的解决办法