机器学习笔记(PART II)模型的评估和选择(I)
来源:互联网 发布:手机电池校准软件 编辑:程序博客网 时间:2024/06/11 03:20
经验误差和过拟合
错误率:
分类错误的样本数占样本总数的比例
如果在
精度:
精度=1-错误率
训练误差(经验误差):
学习器在训练集上的误差
泛化误差
学习区在新样本上的误差
过拟合(过配)
学习能力过于强大,以至于把一些不是太一般的特性都学到了
欠拟合(欠配)
学习能力低下
评估方法
基本思想
使用测试误差来近似泛化误差
注意事项
假设测试样本也是从样本的真实分布中独立同分布采样而得到。测试集应该和训练集互斥,即测试样本尽量不在测试样本中出现。
矛盾点
如果只有一个包含
方法
留出法
方式
“留出法”(hold_out)直接将数据集
注意事项
训练集和测试集的划分要尽可能保持数据分布的一致性,避免因为数据划分过程引入额外的偏差而对最终结果产生影响。
单次留出法的到的结果可能不够可靠,在使用留出法的时候一般要多次划分重复进行试验评估最后取平均值作为留出法的评估结果。
S 和T 的大小问题
如果训练集
如果测试集
交叉验证法
首先将数据集
p 次k 折交叉验证
通常使用“10次10折交叉验证”。
自助法
引入的意义
在留出法和交叉验证法中,由于保留了一部分用于测试,世界评估的模型所使用的训练集
具体做法
直接以自助采样(bootstrap sampling)为基础
给定包含
通过自助采样,初始数据集中有大约36.8%的样本没有出现在采集数据集
- 机器学习笔记(PART II)模型的评估和选择(I)
- 机器学习笔记(III)模型评估与选择(II)
- 机器学习笔记--模型评估与选择
- Stanford机器学习笔记-6. 学习模型的评估和选择
- Stanford机器学习笔记-6. 学习模型的评估和选择
- 机器学习中进行模型评价、模型选择和算法选择的终极方法(PART I)
- 机器学习-模型评估和选择
- 模型评估和选择——周志华的机器学习
- 机器学习的模型评估与选择
- 机器学习-模型的评估与选择
- 机器学习之模型评估与模型选择(学习笔记)
- 《机器学习》第二章 模型评估与选择 笔记2 泛化误差的评估方法
- 机器学习学习笔记(3)----模型评估与选择
- 机器学习-学习笔记 模型评估与选择
- 周志华《机器学习》学习笔记2--模型评估与选择
- 机器学习笔记-模型评估与选择, Training set、Validation set 和 Testing set的区别与作用
- 机器学习笔记(二)模型评估与选择
- 机器学习笔记(二)模型评估与选择
- java. lang.ClassNotFoundException:org.aspectj.lang.annotation.Around
- Hadoop 核心概念解析(转载)
- FZU 1057
- 数据库第一范式 第二范式 第三范式 BC 范式
- childNodes和children
- 机器学习笔记(PART II)模型的评估和选择(I)
- 网页抓取jsoup
- 栈帧草图
- webpack i18n国际化配置
- OkHttp网络请求封装类
- 遍历对象的属性
- 自学mysql(基础篇)
- Eclipse的安装和配置(Windows)
- Java中Synchronized的用法