《数据挖掘概念与技术》学习笔记第7章(7/10)分类和预测
来源:互联网 发布:阿里云主机 价格 编辑:程序博客网 时间:2024/04/28 03:21
分类
第一步,建立一个模型,描述预定的数据类集或者概念集。
第二步,使用模型进行分类。
补充说明:
1 数据类集或者概念集还可以被称为样本、实例、对象。
2为建立模型而被分析的数据类集称为训练数据集。
3 这是一种有指导的学习,而在聚类中,使用的是无指导的学习。
对分类方法进行评估
可以采用的评估标准包括:预测的准确率、速度、强壮性、可伸缩性、可解释性。
判定树的可伸缩性
大部分判定树算法都把训练样本限制在了内存中,然而包含数以百万计样本的非常大的训练集是很普通的。因此,这一限制就制约了算法的可伸缩性。目前针对此问题的的改进算法是SLIQ和SPRINT,核心解决之道是预排序
贝叶斯分类
算法实现(以后单独写出)
其它分类方法
k-最邻近分类
基于案例的推理(case-based reasoning)
遗传算法
粗糙集方法
模糊集方法
预测
一般认为,如果预测结果是离散值,则应该叫做分类。
如果预测结果是连续值,则应该叫做预测。
预测的方法
线性回归:使用最小二乘法
多元回归
非线性回归
- 《数据挖掘概念与技术》学习笔记第7章(7/10)分类和预测
- 《数据挖掘概念与技术》学习笔记第2章(2/10)数据仓库和数据挖掘的OLAP技术
- 《数据挖掘概念与技术》学习笔记第4章(4/10)数据挖掘原语、语言和系统结构
- 《数据挖掘概念与技术》学习笔记第9-10章_复杂数据类型的挖掘+数据挖掘的应用和发展趋势(9/10)+(10/10)
- 《数据挖掘概念与技术》学习笔记第3章(3/10)数据预处理
- 《数据挖掘概念与技术》学习笔记第1章(1/10)引言
- 《数据挖掘概念与技术》学习笔记第8章(8/10)聚类分析
- 《数据挖掘概念与技术》学习笔记第5章(5/10)概念描述: 特征化与比较
- 《数据挖掘概念与技术》学习笔记第6章(6/10)挖掘大型数据库中的关联规则
- 《数据挖掘概念与技术》学习笔记
- 《数据挖掘概念与技术》学习笔记 .
- 《数据挖掘概念与技术》学习笔记
- 数据挖掘概念与技术-学习笔记
- 数据挖掘算法--分类与预测笔记
- 【数据挖掘概念与技术】学习笔记2-认识数据
- 【数据挖掘概念与技术】学习笔记3-数据预处理
- 数据挖掘概念与技术 第2章 认识数据
- 数据挖掘概念与技术 第3章 数据预处理
- 为什么呢
- tomcat 6.0使用
- vsftpd(ftp服务器)在linux上的移植
- PHP中的类型转换规则
- assert() 函数用法
- 《数据挖掘概念与技术》学习笔记第7章(7/10)分类和预测
- 新的开始
- 磊科(NetCore) nw330 usb无线网卡 win7 x86 驱动程序 (for windows7 32位)
- SQL SERVER 2005 数据库镜像 高性能模式(三)
- 创建格式良好的XML文档(上篇)
- 嵌入式VC编程问题与解决方法(不断更新)
- Linux文件查找命令find,xargs详述
- C++交叉类
- 创建格式良好的XML文档(下篇)