机器学习中的validation

来源:互联网 发布:英文域名例子 编辑:程序博客网 时间:2024/06/15 06:34

在机器学习领域中,模型的检验十分重要,用于判断机器学习到的模型的好坏。主要有以下两种:

留一验证:

留一验证比较简单,就是从任务提供的数据中随机采样一定比例作为训练集,剩下的留作验证集。通常这个比例为4:1,也就是80%作为训练,20%作为模型验证。也有很多是会是3:1等等。这有一个问题,那就是随机采样验证集存在不确定性。验证集合不是测试集,这是不同的两个概念。

交叉验证:

交叉验证其实就是多次的留一验证的过程。不过每次使用的验证集之间是互斥的,并且保证每一条可用数据都被模型验证过。下面就以5折交叉验证作为例子,将所有可用数据随机分为5分,每次迭代用其中一组数据作为验证集,其他四组作为训练集。交叉验证更加可靠、稳定。因为所有数据都被训练和验证过。实际中通常是分成10份,具体多少份,有自己决定.

阅读全文
0 0
原创粉丝点击