Training set、Validation set and Testing set

来源:互联网 发布:网络追逃人员查询系统 编辑:程序博客网 时间:2024/06/11 01:04

training set用来训练模型,validation set用于模型的选择,而testing set用于最终对学习方法评估。在学习到的不同复杂度的模型中,选择对验证集有最小预测误差的模型。由于验证集有足够多的数据,用它对模型进行选择也是有效的。

1.training sets是用作训练时调整神经网络的weights; 
2.validation sets并不是用作调整weights,而是用作防止overfitting的。如果由training sets得到的精度随着训练的进行在增加,而这个模型经过validation sets计算后,发现精度与之前保持不变,或者精度反而下降了。这说明,已经产生overfitting了,需要停止训练。validation sets的作用不仅仅是在训练中防止训练模型过拟合,平衡training accuracy与validation accuracy,而且有“compare their performances and decide which one to take”

3.testing sets只用来测试模型,来看这个模型究竟有多好,就是评价这个模型的泛化能力(generalization)。 这时候,这个model在testing sets上得到的accuracy就是一个很有代表性(representative)的accuracy,以后再在新的数据集上测试时,也跑不离这个精度的范围。

以上内容摘自http://blog.csdn.net/u010167269/article/details/51340070如需了解详细的信息以及小样本处理方法可点击跳转。