2.2 评估方法
来源:互联网 发布:又拍云存储 域名 编辑:程序博客网 时间:2024/06/05 21:14
2 模型评估与选择-评估方法
- 留出法(hold-out)
- 交叉验证法(cross validation)
- 自助法(bootstrapping)
- 调参(parameter tuning)
3.1 留出法
将数据集 $D$ 划分为 $S, T$:
并采用**分层采样(stratified sampling)**,通常选用 $2/3 - 4/5$ 用于训练。
3.2 交叉验证法
将 $D$ 划分为 $k$ 个大小相似的互斥子集:
每次用 $k-1$ 个子集作为训练集,剩下一个作为测试集,称为**k折交叉验证(k-fold cross validation)**。$k$ 通常取 10,并随机使用不同划分重复 $p$ 次,最终取 $p$ 次结果均值,例如“10次10折交叉验证”。
假设数据集 $D$ 容量为 $m$,若 $k = m$,则称为**留一法(Leave-One-Out, LOO)**。留一法苹果结果比较准确,但计算开销也相应较大。
3.3 自助法
以**自助采样法(bootstrap sampling)**为基础,从 $D$ 中有放回地随机抽取 $m$ 次,得到同样包含 $m$ 个样本的 $D'$,$D$ 中有一部分样本会在 $D'$ 中出现多次,而另一部分则未出现,$m$ 次重采样始终未被采到的概率是:
即 $36.8\%$ 的样本未出现在 $D'$。以 $D'$ 作为训练集,$D - D'$ 作为测试集。自助法在数据集较小、难以划分训练/测试集时很有用。
阅读全文
0 0
- 2.2 评估方法
- 软件工作量评估方法
- 广告评估方法
- 项目评估方法
- 可用性评估方法
- stat_模型评估方法
- 软件工作量评估方法
- RAM评估方法详解
- ROM评估方法
- 软件工作量评估方法
- 模型评估方法
- 模型的评估方法
- 【方法】搜索排序评估方法
- 风险分析评估方法介绍
- 评估系统各项性能方法
- 系统吞吐量评估方法(冯凌圣)
- 系统吞吐量评估方法(冯凌圣)
- 系统吞度量评估方法
- Groovy语法之闭包
- xxx cannot be resolved to a type
- js基本功—干货
- Java 自带的线程池Executors.newFixedThreadPool
- [NOIP模拟赛]同色齿轮问题
- 2.2 评估方法
- 欢迎使用CSDN-markdown编辑器
- EL表达式使用判断
- AC自动机
- BeyoundCompare
- 【Mybatis从0到1-009】订单商品模型数据分析
- zzuli 2172 GJJ的日常之购物【dp+优先队列】
- ubuntu14.04更换内核为3.14
- SQL进阶语句