机器学习中的训练集,验证集及测试集的关系
来源:互联网 发布:java ssh 远程服务器 编辑:程序博客网 时间:2024/04/30 15:28
最近在看机器学习的东西发现验证集的(Validation set) 有时候被提起到,以时间没明白验证集的真正用途。
首先,这三个名词在机器学习领域的文章中是很常见的,以下是这三个词的定义。
Training set: A set of examples used for learning, which is to fit the parameters [i.e., weights] of the classifier.
Validation set: A set of examples used to tune the parameters [i.e., architecture, not weights] of a classifier, for example to choose the number of hidden units in a neural network.Test set: A set of examples used only to assess the performance [generalization] of a fully specified classifier.
训练集:学习样本数据集,通过匹配一些参数来建立一个分类器。建立一种分类的方式,主要是用来训练模型的。
验证集:对学习出来的模型,调整分类器的参数,如在神经网络中选择隐藏单元数。验证集还用来确定网络结构或者控制模型复杂程度的参数。
测试集:主要是测试训练好的模型的分辨能力(识别率等)
显然,training set是用来训练模型或确定模型参数的,如ANN中权值等; validation set是用来做模型选择(model selection),即做模型的最终优化及确定的,如ANN的结构;而 test set则纯粹是为了测试已经训练好的模型的推广能力。当然,test set这并不能保证模型的正确性,他只是说相似的数据用此模型会得出相似的结果。但实际应用中,一般只将数据集分成两类,即training set 和test set,大多数文章并不涉及validation set。
针对数据偏差与数据方差的关系
偏差:描述的是预测值(估计值)的期望与真实值之间的差距。偏差越大,越偏离真实数据,如下图第二行所示。
方差:描述的是预测值的变化范围,离散程度,也就是离其期望值的距离。方差越大,数据的分布越分散,如下图右列所示。<img src="https://pic1.zhimg.com/162bbe3ae6c8f46da4f4e05edea2d9fc_b.jpg" data-rawwidth="936" data-rawheight="886" class="origin_image zh-lightbox-thumb" width="936" data-original="https://pic1.zhimg.com/162bbe3ae6c8f46da4f4e05edea2d9fc_r.jpg">参考:
- 机器学习中的训练集,验证集及测试集的关系
- 机器学习中的训练集,验证集及测试集的关系
- 机器学习中的训练集,验证集及测试集的关系
- 机器学习中的训练集,验证集及测试集的关系
- 机器学习中的训练集,验证集及测试集的关系
- 机器学习: 训练集、验证集、测试集关系
- 机器学习中的训练集、验证集和测试集
- 机器学习----训练集、验证集、测试集
- 训练集,验证集和测试集的关系
- 机器学习中训练集、验证集和测试集的作用
- [机器学习]划分训练集和测试集的方法
- 机器学习 数据挖掘 数据集划分 训练集 验证集 测试集
- 机器学习中训练集、验证集(开发集)、测试集如何划分
- 神经网络训练中的训练集、验证集以及测试集合
- 神经网络训练中的训练集、验证集以及测试集合
- 机器学习之训练集_验证集_测试集
- 【七】机器学习之路——训练集、测试集及如何划分
- 深度学习训练及测试时的三个“集”
- [疯狂Java笔记]图形用户界面、AWT、Swing简介
- gulp压缩js和css
- POJ-1584-A Round Peg in a Ground Hole-计算几何-凸多边形+多边形包含圆
- JSP_004_Cookie介绍02—Cookie的最大生命和Cookie的path
- js中小数向上取整数,向下取整数,四舍五入取整数的实现。
- 机器学习中的训练集,验证集及测试集的关系
- 关于jQuery $(selector).addClass(class) IE8 兼容的说法
- Spark性能优化(1)
- Android4.2.2自增物理按键
- NEXTVAL 和 CURRVAL 运算符和oracle的sequence设置说明
- linux下如何修改DNS地址
- codeforces-1A-Theatre Square( 测试一下cf平台,囧 )
- 一个适用于CentOS下的Redis启动脚本
- muduo库的学习9---TcpServer与TcpClient的基本设计---TcpConnection成员