机器学习-模型评估与选择
来源:互联网 发布:艾瑞数据查询 编辑:程序博客网 时间:2024/05/29 09:31
模型评估与选择
错误率:
训练误差|经验误差:学习器在训练集上的误差
泛化误差:学习器在新样本上的误差
1.评估方法
- 留出法 :将两个数据集
- 交叉验证法:将数据集
- 自助法:数据集
论证:每一样本一次被获取的概率都为
1.1评价:
留出法与交叉验证:由于保留了一部分数据集作为验证,必然会引入因为训练样本规模不同而导致的估计偏差。
留一法:受样本规模影响小,但计算复杂度太高。
自助法:数据集较小、难以有效划分训练/测试集时有用
2.性能度量
- 均方误差:
更一般的:
- 查准率、查全率、F1
查准率与查全率是一对矛盾的度量:好瓜尽量多的选出来,查准率就低了;选出的瓜好瓜多,查全率低了。
- F1度量
一般形式
- ROC与AUC
ROC:全称“受试者工作特征”。其纵坐标为“真正例率”,简称TPR;横坐标为“假正例率”,简称FPR。
AUC:ROC曲线下的面积.AUC=1,是完美分类器(并不存在);0.5
3.假设检验
二项检验、t检验、交叉验证t检验、McNemar检验(
4.偏差与方差
偏差(bias):期望输出与真实标记的差别,刻画学习算法本身的拟合能力
方差(var):预测值的变化范围,离散程度,刻画数据波动对学习性能的变化
噪声:刻画学习问题本身的难度
于是,
E(f;D)=bias2(x)+var(x)+ε2
泛化误差可以分解为偏差、方差与噪声之和.解释为泛化性能由学习算法的能力、数据的充分性以及学习任务本身的难度所共同决定。
一般来说,偏差和方差是有冲突的,称为偏差-方差窘境。训练不足-拟合能力不够-训练数据波动对学习器影响小-偏差主导;训练加深-拟合能力够-训练数据波动渐渐被学习器学习-方差主导;训练充足-拟合能力很强-训练数据波动对学习器影响很大-过拟合
阅读全文
0 0
- 机器学习模型评估与选择
- 机器学习(二) 模型评估与选择
- 机器学习----模型评估与选择
- 机器学习—模型评估与选择
- 周志华 机器学习 模型选择与评估
- 机器学习笔记--模型评估与选择
- 机器学习的模型评估与选择
- 机器学习-模型的评估与选择
- 机器学习模型评估与选择
- 机器学习-模型评估与选择
- 机器学习之模型评估与模型选择(学习笔记)
- 机器学习之模型评估与模型选择
- 机器学习——模型评估与模型选择
- 机器学习学习笔记(3)----模型评估与选择
- 机器学习-学习笔记 模型评估与选择
- 周志华《机器学习》学习笔记2--模型评估与选择
- 机器学习-周志华-课后习题答案-模型评估与选择
- 机器学习(周志华) 参考答案 第二章模型评估与选择
- php编译参数详解
- 从零开始搭建app—首页导航栏实现(一)
- 精选30道Java笔试题解答
- MarkDown 常用语法
- redis(5)——RDB持久化
- 机器学习-模型评估与选择
- 【日常学习笔记】PHP上传文件时权限问题~
- Python自学第一课
- oracle 一次删除多张表
- HDPCD-Java-复习笔记(20)
- MarkDown 常用语法延展
- 二分查找
- java基础知识
- python 中赋值 copy() 与 ' = ' 号以及比较符'=='号 与 'is'