个人笔记

来源：互联网发布：七天网络查询成绩注册编辑：程序博客网时间：2024/06/05 06:17

1、为了避免过拟合的情况，通常的做法就是在损失函数的基础上加上一个关于特征权重的限制，主要用于限制他的模不要太大，可以表示为一个带约束的优化问题，即正则化项。

2、决策树学习采用的是自顶向下的递归方法, 其基本思想是以信息熵为度量构造一棵熵值下降最快的树,到叶子节点处的熵值为零, 此时每个叶节点中的实例都属于同一类。

3、随机森林能够解决, 决策树的过拟合问题. 随机森林用训练集生成多个(非常深的)决策树.在预测时, 每个树的都会预测一个结果, 每个结果加权表决, 来避免过拟合。

4、求极大似然，就是利用已知的样本分布，找到最有可能（即最大概率）导致这种分布的参数值；或者说什么样的参数才能使我们观测到目前这组数据的概率最大。

5、移动坐标轴，将n维特征映射到k维上（k<n），这k维是全新的正交特征。这k维特征称为主元，是重新构造出来的k维特征，而不是简单地从n维特征中去除其余n-k维特征。

0 0