机器学习(周志华 )-2模型评估与选择
来源:互联网 发布:微信点菜系统源码 编辑:程序博客网 时间:2024/05/30 23:10
机器学习(周志华 )-2模型评估与选择
标签(空格分隔): 机器学习
经验误差与过拟合
错误率
误差:训练误差 泛化误差
欠拟合 过拟合
评估方法
留出法
训练集S 测试集T
约2/3-4/5用于训练集,其余用于测试集
- 分层采样
- 随机划分,一般采用若干次随机划,重复进行 实验评估后取平均值
交叉验证法
先将数据集分为k个大小相似的互斥子集(当然,每个子集的产生都要用分层抽样进行)。每次用k-1个子集作为训练集,剩下的一个作为测试集。这样就可以进行k次训练-测试。k的测试结果的平均值就是最终的测试结果。
k折交叉验证通常 要随机采用不同的划分重复p次,最终返回p次k折交叉验证结果的均值,比如10次10折交叉验证
自助法
假设有一个包含m个样本的数据集D。对这个数据集进行m次有放回的抽样,则得到了一个含有m个样本的数据集D’。D’相对于原数据集D,规模没有减少,只是D’中有部分样本是重复出现的。所以在抽样中没有抽到的样本就作为测试集,D’就作为训练集。
样本在m次采样中始终不会被采到的概率是
一般来说抽样中会有三分之一的样本没有被抽到,也就是说测试集大小为数据集D大小的三分之一。
自助法在数据集较小,难以有效划分训练/测试集时有用,但是自主法产生的数据集改变了初始数据集的分布,会引入估计偏差
调参与最终模型
- 算法的参数,数目通常在10以内
- 模型的参数,数目可能很多
用测试集上的判别效果来估计模型在实际使用中的泛化能力,而把训练数据划分为训练集和验证集,基于验证集上的性能来进行模型选择和调参
性能度量
性能度量:衡量模型泛化能力的评价标准
均方误差:回归任务常用的性能度量
一般的,对于数据分布和概率密度函数p(*)
错误率与精度
错误率:分类错误的样本占总样本的比例
精度:分类正确的样本占总样本的比例
更一般的
查准率 查全率与 F1
查准率:
查全率:
学习器性能的判定:
- 若学习器A的P-R曲线完全包住学习器B的曲线,则学习器A的的性能较优
- 若若学习器A的P-R曲线与坐标轴包围的面积大于学习器B的面积,则学习器A的的性能较优
- 平衡点:查准率=查全率 若平衡点A>B,则学习器A的的性能较优
- F1度量:
F1度量的一般形式:
宏查全率:
宏查准率:
宏查准率:
微查准率:
微查全率:
微查准率:
ROC与AUC
ROC:受试工作者特征,
ROC曲线:FPR-TPR曲线
真正例率:
假正例率:
给定
学习器性能的判定:
- 若学习器A的ROC曲线完全包住学习器B的曲线,则学习器A的的性能较优
- AUC:ROC曲线与坐标轴包围的面积。若学习器A的AUC大于学习器B的AUC,则学习器A的的性能较优
给定
即考虑每一对正、反例?若正例的预测值小于反例?则记一个”罚分 等?则t记己 0.5 个”罚分”容易看出 ,
代价敏感错误率与代价曲线
以二分类任务为例,我们可根据任务的领域知识设定一个”代价矩
阵” (cost matrix) ,其中
样本的代价.一般来说 , costii= 0;
非均等代价
有考虑不同错误会造成不同的后果.从而有不同的代价
将上表中的第 0 类作为正类、第 1 类作为反类,令
类似的,可给出基于分布定义的代价敏感错误率,以及其他一些性能度量,如精度的代价敏感版本.若令 costij 中的 i ,j 取值不限于0,1 ,则可定义出多分类任务的代价敏感性能度量.
代价曲线
在非均等代价下, ROC 曲线不能直接反映出学习器的期望总体代价,而”代价曲线” (cost curve) 则可达到该目的.代价曲线图的横轴是取值为 [0 , 1]的正例概率代价
纵轴是取值为【0.1】的归一化代价
其中FPR 是假正例率,FNR=1-TPR是假反例率.
ROC 由线上每一点对应了代价平面上的一条线段 ,设 ROC曲线上点的坐标为 (TPR, FPR) ,则可相应计算出 FNR,然后在代价平面上绘制一条从 (O , FPR) 到 (l , FNR) 的线段,线段下的面积即表示了该条件下的期望总体代价;如此将 ROC 曲线土的每个点转化为代价平面上的一条线段,然后取所有线段的下界,围成的自积即为在所有条件下学习器的期望总体代价。
比较检验
假设检验
二项检验
t检验
交叉验证t检验
MacNemar检验
Friendman检验与Nemenyi后续检验
偏差与方差
- 机器学习(周志华 )-2模型评估与选择
- 周志华 机器学习 模型选择与评估
- 周志华《机器学习》学习笔记2--模型评估与选择
- 周志华《机器学习》第 2 章 模型评估与选择
- 周志华《机器学习》笔记:2、模型评估与选择
- 机器学习(周志华)- 第2章模型评估与选择笔记
- 机器学习模型评估与选择
- 机器学习(二) 模型评估与选择
- 机器学习----模型评估与选择
- 机器学习—模型评估与选择
- 机器学习笔记--模型评估与选择
- 机器学习的模型评估与选择
- 机器学习-模型的评估与选择
- 机器学习模型评估与选择
- 机器学习-模型评估与选择
- 机器学习-周志华-课后习题答案-模型评估与选择
- 机器学习(周志华) 参考答案 第二章模型评估与选择
- [机器学习 - 周志华] - 第二章 - 模型评估与选择
- 【北邮OJ】88. 最值问题
- 一些常用的数学符号
- c语言实现快速排序
- 关于Java Unsafe
- C#入门 自用笔记 9*9算术表的生成。
- 机器学习(周志华 )-2模型评估与选择
- RDC 表达式
- 关于ajax的学习笔记(心得)
- 121. 122.123 Best Time to Buy and Sell Stock
- LDS文件格式分析
- 德国CeBIT 2017,数字冰雹开启智慧城市决策新视角
- 淘淘商城第二天
- SQL数据类型、基本表的定义、索引定义
- 高并发相关