模型评估-留出法
来源:互联网 发布:mysql 5.7 for linux 编辑:程序博客网 时间:2024/05/26 05:51
对于一个机器学习问题,我们通常有数据集D(用于训练模型),但我们还需要评估模型,因此不能把整个D用于训练,因为拿训练过的数据再去评估必然无效。那么最基本的方法就是留出法:
把D划分为两部分:训练集S和测试集T,其中SUT=D,S∩T=Φ。
划分时一般不宜随机划分,因为如果T中正好只取到某一种特殊类型数据,从而带来了额外的误差。此时处理方法要视具体情况而定,如当数据明显的分为有限类时,可以采用分层抽样方式选择测试数据,保证数据分布比例的平衡。
大多情形下,难以得到合适的测试集,此时一般多次重复划分-训练-测试求误差的步骤,取误差的平均值。
留出法带来一个无法避免的矛盾:
我们初始动机是“评估数据集D训练出的模型”但是我们把数据集分开了,导致:
Ⅰ 若 S较大T较小,那么S训练出的模型与D训练的模型相似,但是T太少,评估结果偶然性大,不准确。
Ⅱ 若S较小T较大,那么S与D训练出的模型差异较大,T的评估失去意义。
这种矛盾是无法避免的。常用做法是选择1/5-1/3左右数据用于评估。
阅读全文
0 0
- 模型评估-留出法
- 模型评估
- 模型评估
- 模型评估
- 模型评估
- 模型评估-交叉验证与自助法
- 测试计划评估模型
- 模型的评估
- 模型评估&AUC
- 如何评估模型好坏
- 语言模型如何评估
- stat_模型评估方法
- 模型评估与选择
- 模型评估笔记
- 模型评估与选择
- 模型评估方法
- 模型评估与选择
- sklearn中的模型评估
- okhttp同步/异步
- 【Spring Security实战系列】Spring Security实战(五)
- arxiv | 技术概述深度学习:详解前馈、卷积和循环神经网络
- unity3d 任务头上的血条
- bzoj1726 [Usaco2006 Nov]Roadblocks第二短路(spfa)
- 模型评估-留出法
- 91免费▪分享:什么是共享经济?共享经济共享的都是什么?
- Android 通知(使用NotificationCompat.Builder )
- Eclipse快捷键的设置和使用
- 关于makefile中的命令执行问题
- SSH 出现 The authenticity of host xxx can't be established
- 灵玖软件:大数据挖掘成企业发展新动力
- vuejs第二篇 vue-cli配置移动端自适配(引入flexible)
- 获取int值的完整32位字符串(1)