机器学习笔记(X)线性模型(VI)类别不平衡问题
来源:互联网 发布:用友软件销售 编辑:程序博客网 时间:2024/05/24 02:40
类别不平衡问题
分类学习方法的问题
假设正类和反类的样例数目相当,但是有时候样例数量的差别较大,比如正例样本有998个,而反例样本只有2个,此时学习方法如果一直返回正例则预测的准确度会高达
类别不平衡的定义
假设
假定正类样本较少,反类样本较多
处理方法
从线性分类器的角度讨论,在使用
关于y
决策规则
类别不平衡的处理
观测几率:
此时决策规则改为:
采样
假定正类样本较少,反类样本较多
欠采样
减少多的,这里除去一些反例样本,使得正反例样本数量接近
过采样
增加少的,这里增加一些正例样本,使得正反例样本数量接近
基于原始训练集
对样本数量不做处理,保持原状,
使用再缩放策略,
再缩放
将上式嵌入到决策过程中。
阅读全文
0 0
- 机器学习笔记(X)线性模型(VI)类别不平衡问题
- 机器学习笔记(VI)线性模型(II)多维最小二乘法
- 机器学习笔记-多分类学习,类别不平衡,决策树
- 《西瓜书》笔记03:多分类学习和类别不平衡问题(3)
- 机器学习笔记(二) 线性模型
- pearson 相关系数 & 机器学习模型中不平衡样本问题
- 机器学习笔记-线性模型
- 机器学习中的不平衡问题
- 【机器学习】数据不平衡问题
- 类别样本不平衡问题
- 机器学习-学习笔记 线性模型(二)
- 机器学习线性模型学习笔记
- 机器学习-学习笔记 线性模型
- 机器学习笔记五:广义线性模型(GLM)
- 机器学习笔记4——线性模型(一)
- 机器学习笔记5——线性模型(二)
- 机器学习笔记(三)线性模型
- 机器学习笔记 (1)-线性回归模型
- RabbitMQ-Java客户端API指南-上
- RabbitMQ-Java客户端API指南-下
- RabbitMQ吞吐量测试-PerfTest上
- kafka-0.9消费者新API
- RabbitMQ高可用镜像队列
- 机器学习笔记(X)线性模型(VI)类别不平衡问题
- 我国 I T 企业是如何吸引风险投资
- 基础数据结构
- okhttp的二次封装
- 不爱学习的小W hnust
- gitlab 搭建
- git-server安装
- nginx安装
- Bottobar 实现分类页面