样本不平衡--SMOTE算法-学习笔记

来源:互联网 发布:朱自清背影网络 编辑:程序博客网 时间:2024/05/22 09:50

1 SMOTE算法的简单理解

一个数集中的数据是分布在特征空间中的,假设数据是2维的,那么数据的就是一个平面上的点。对于类别不平衡数据来说,假设负样本数据是少量的,那么这个数据只占据了空间的一小部分。SMOTE 算法就是对这些小样本数据占据的空间中进行插值。 而不影响到正样本的空间。

2 如何插值

SMOTE算法采取了一种策略,选择两个距离接近的点进行插值。

0 0
原创粉丝点击