技术文章 | 分类算法总结

来源:互联网 发布:我当道士那些年 知乎 编辑:程序博客网 时间:2024/06/07 08:25

本文来源于阿里云-云栖社区,原文点击这里


分类算法

 决策树分类算法


决策树归纳是经典的分类算法。

它采用自顶向下递归的各个击破方式构造决策树。

树的每一个结点上使用信息增益度量选择测试属性。

可以从生成的决策树中提取规则.


 KNN法(K-Nearest Neighbor):

KNN法即K最近邻法,最初由Cover和Hart于1968年提出的,是一个理论上比较成熟的方法。

该方法的思路非常简单直观:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。

该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

KNN方法虽然从原理上也依赖于极限定理,但在类别决策时,只与极少量的相邻样本有关。

因此,采用这种方法可以较好地避免样本的不平衡问题。

另外,由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。


 展开全文