交叉验证集和测试集

来源:互联网 发布:免费视频网站源码 编辑:程序博客网 时间:2024/05/29 11:51

在监督学习中主要有两种数据分类方法:

1. 将数据集分为三部分:训练集、验证集和测试集

2. 将数据集分为两部分:训练集、测试集

 

验证集合测试集的区别:验证集主要是用来进一步确定模型中的参数(正则项系数、隐含层节点个数),而测试集主要是用来评估模型的精确度(泛化能力)。

 

对于第一种方法即首先用取得最小误差的验证集的参数取值模型作为所选的最佳模型,然后采用测试集对这个最佳模型进行评价。第二种方法直接对最小误差的测试集作为评价并不合理,因为这个模型本来就是最为满足的模型。

 

原创粉丝点击