算法

来源:互联网 发布:oracle数据库教程 编辑:程序博客网 时间:2024/06/11 18:48

1.k-近邻算法(kNN):选择k(k<=20)个最相似数据中出现次数最多的分类,作为新数据的分类。

优点:精度高、对异常值不敏感、无数据输入假定。
缺点:计算复杂度高、空间复杂度高。
适用数据范围:数值型和标称型。


2.决策树 :重点在于选择哪一个属性作为分裂属性。

优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。
缺点:可能会产生过度匹配问题。
适用数据类型:数值型和标称型。

分裂规则有:最高信息增益
                     增益率
                     基尼指数

原创粉丝点击