机器学习中的validation

来源：互联网发布：英文域名例子编辑：程序博客网时间：2024/06/15 06:34

在机器学习领域中，模型的检验十分重要，用于判断机器学习到的模型的好坏。主要有以下两种：

留一验证：

留一验证比较简单，就是从任务提供的数据中随机采样一定比例作为训练集，剩下的留作验证集。通常这个比例为4:1，也就是80%作为训练，20%作为模型验证。也有很多是会是3:1等等。这有一个问题，那就是随机采样验证集存在不确定性。验证集合不是测试集，这是不同的两个概念。

交叉验证：

交叉验证其实就是多次的留一验证的过程。不过每次使用的验证集之间是互斥的，并且保证每一条可用数据都被模型验证过。下面就以5折交叉验证作为例子，将所有可用数据随机分为5分，每次迭代用其中一组数据作为验证集，其他四组作为训练集。交叉验证更加可靠、稳定。因为所有数据都被训练和验证过。实际中通常是分成１０份，具体多少份，有自己决定．

阅读全文

0 0