数据挖掘方法比较

来源:互联网 发布:yunos自动删除软件 编辑:程序博客网 时间:2024/06/04 18:01

一、可解释性和应用广泛性

1、决策树:简单直观,逻辑性强,易于理解和应用,广泛使用。

2、神经网络:可解释性差,远没有决策树和回归应用广泛。

3、Logistic回归:更为成熟、应用更为广泛,具有强大的活力和最广泛的业务应用基础。

二、缺失值和异常值敏感情况

1、决策树:对缺失值几乎不做处理即可应用,不易受到异常值影响。

2、神经网络:对缺失值敏感,需要对缺失值处理(赋值、替换或删除),对异常值和噪声不敏感。

3、Logistic回归:不能处理缺失值,需要对缺失值(赋值、替换或删除),对异常值敏感,应删除。

三、变量个数和质量的要求

1、决策树:本身就是挑选变量的过程。

2、神经网络:少而精。

3、Logistic回归:变量筛选(向前引入法、向后剔除法、逐步回归法)。

四、过拟合现象

相比于决策树和逻辑回归,神经网络可以挑选非线性关系,较好的拟合数据,也更容易过拟合。

五、模型诊断指标和措施

1、决策树:贪心算法。

2、神经网络,缺乏成熟的模型评判方案。

3、Logistic回归:丰富的指标判断(ROC、LIFT)。

0 0
原创粉丝点击