决策树逻辑回归 KNN 的原理

来源：互联网发布：mac苹果铃声制作编辑：程序博客网时间：2024/05/17 01:19

决策树：每个内部节点代表一种特征叶子节点代表一种分类。基于训练数据建立决策树的过程是特征选取的过程，递归地根据特征的信息增益来选取信息增益较大的特征，用这个特征来划分特征空间，得到的特征空间来当做决策树的节点。这样的决策树生成算法叫 ID3算法，将ID3算法中的信息增益换成信息增益比便是C4.5 算法，这两个算法的过程都是极大似然估计的过程。CART分类决策树用的是基尼指数（与信息熵类似，表征集合的确定性）来划分特征空间。

为了防止过拟合，将生成的决策树进行剪枝简化：建立损失函数包含两部分对训练数据的预测误差和决策树的复杂程度。从决策树的叶子节点向上递归计算使使损失函数最小的决策树。

逻辑回归：建立逻辑分布分类模型用极大似然函数估计参数

KNN：离目标点距离最近的K个数据点来决定目标点的所属类型。三个基本要素是：距离函数（欧氏距离曼哈顿距离） K值选取（交叉验证）分类决策规定（多数表决）。K近邻的选取用 kd树结构

0 0

决策树 逻辑回归 KNN 的原理

决策树逻辑回归 KNN 的原理