数据挖掘与数据分析方面面试题(1)

来源:互联网 发布:网线推广优化 编辑:程序博客网 时间:2024/04/29 14:14

什么是异常值,列举一种找出连续型变量异常值的方法

异常值是指,与大部分样本值的差别较大,也就是离群值。

寻找连续型变量异常值的方法可以是这样的:

首先,计算样本的标准差;然后,以3倍的标准差作为阈值判断该值是否为异常值,集如果该值与均值的差的绝对值大于阈值,则该值为异常值,反之,为正常值。



0 0