交叉验证

来源:互联网 发布:数据库实用教程pdf 编辑:程序博客网 时间:2024/06/05 00:42

交叉验证方法一般应用在训练集数量较小(因此验证集的数量更小)的情况下。例如5折法/10折法。

如之前KNN博客所说,KNN中K为其中一个超参,以该算法为例,我们就可以应用交叉验证的方法来选取K值。

下图为5折法图例。

这里写图片描述

每当选取一个K值,如K=3,我们将数据集等分成五份,其中循环的将这五份分别作为验证数据集,其余四份作为训练数据集。然后,将五份的验证结果取平均,用以说明K=3时的性能。最后比较不同K值下accuracy的值,从而确定K的取值

原创粉丝点击