数据挖掘方法比较
来源:互联网 发布:yunos自动删除软件 编辑:程序博客网 时间:2024/06/04 18:01
一、可解释性和应用广泛性
1、决策树:简单直观,逻辑性强,易于理解和应用,广泛使用。
2、神经网络:可解释性差,远没有决策树和回归应用广泛。
3、Logistic回归:更为成熟、应用更为广泛,具有强大的活力和最广泛的业务应用基础。
二、缺失值和异常值敏感情况
1、决策树:对缺失值几乎不做处理即可应用,不易受到异常值影响。
2、神经网络:对缺失值敏感,需要对缺失值处理(赋值、替换或删除),对异常值和噪声不敏感。
3、Logistic回归:不能处理缺失值,需要对缺失值(赋值、替换或删除),对异常值敏感,应删除。
三、变量个数和质量的要求
1、决策树:本身就是挑选变量的过程。
2、神经网络:少而精。
3、Logistic回归:变量筛选(向前引入法、向后剔除法、逐步回归法)。
四、过拟合现象
相比于决策树和逻辑回归,神经网络可以挑选非线性关系,较好的拟合数据,也更容易过拟合。
五、模型诊断指标和措施
1、决策树:贪心算法。
2、神经网络,缺乏成熟的模型评判方案。
3、Logistic回归:丰富的指标判断(ROC、LIFT)。
0 0
- 数据挖掘方法比较
- 数据挖掘—决策树几种方法的比较
- 数据挖掘分类算法比较
- 数据挖掘分类算法比较
- 数据挖掘 - 分类算法比较
- 主要数据挖掘软件比较
- 数据挖掘方法汇总
- 数据挖掘方法
- 数据挖掘方法分类
- 数据挖掘方法
- 数据挖掘常用方法
- 机器学习、数据挖掘相关方法的原理和性能比较
- 数据挖掘中聚类算法比较研究
- 数据挖掘中聚类算法比较研究(zt)
- 开源数据挖掘工具比较
- 数据挖掘中的分类算法比较
- 数据挖掘-比较好的网站
- 数据挖掘--聚类方法
- linked-list-cycle(LeetCode)
- 关于AVCaptureDevice
- Android发送邮件到指定邮箱(可带附件)
- 习题10-6 UVA - 1210 Sum of Consecutive Prime Numbers 连续素数之和(滑动窗口)
- Linux Char-Driver (字符驱动 摘要)(一)
- 数据挖掘方法比较
- Java之——使用JMX监控Tomcat
- 一个不怕机器识别的图形验证码方案
- Android自动化测试之Robotium学习(二)
- Logistic回归总结
- Middle-题目84:82. Remove Duplicates from Sorted List II
- 4.自定义View
- 常用负载均衡算法
- 查找笔记