[每日问答]ID3,C4.5,CART的区别是什么?

来源:互联网 发布:mac os 彻底重装系统 编辑:程序博客网 时间:2024/06/07 23:16

ID3:根据“最大信息增益”原则选择划分当前数据集最好的特征,按照特征的所有取值进行划分。一旦按照某种特征进行切分后,该特征在之后的计算中就不再起作用。
C4.5:ID3的划分原则有个缺点,它一般会选择属性值较多的特征,C4.5使用“信息增益率”来作为特征切分的准则,同时C4.5还弥补了ID3不能处理特征属性值连续的问题。
CART:它是一棵树,采用二元切分法将数据切成两份分别进入左子树和又子树,采用Gini系数作为切分标准,主要反映切分后数据的不纯度。回归树采用方差缩减作为切分标准。

原创粉丝点击