判断数据变化的标准以及预测、异常预警

来源:互联网 发布:时代网络大厦 公司 编辑:程序博客网 时间:2024/06/05 09:03

判断数据变化的标准以及预测、异常预警模型:

 

1均值一般采用平均数。如果有偏差非常大的异常值,即不仅超过此范围,并且是远远超出平如果均数很多的异常值,则均值采用中位数替代

中位数即从小到大排序时第50%n 个数。

如果n为奇数,则排序后第(n+1)/2个数即为中位数

如果n 为偶数,则排序后第n/2个数和第(n/2+1)个数的平均数为中位数

2趋势一般采用差额分析或者比率分析法,在时间序列上比较两期或多期差额或者环比比率;

预测可以采用均数预测、

如果考虑到影响因素可以采用简单的线性回归预测:因变量跟自变量的线性关系y=a+bx

但要注意:方程的确定性系数R2,方程中变量XY的解释程度。R2取值在01之间,越接近1,表明方程中XY的解释能力越强

3异常值的判定首先来自于业务经验 项目中的异常值是输出给报警系统,标记一下。  

找异常值方法:

1)      用均数+/- STDEV*1.96来区分异常值;

2)      用均数+/- IQR*1.5来区分异常值;

偏差通过方差、标准差来解释,反应数据的稳定性

标准差的公式为σ=sqrt((∑(X1-Xmean)^2)/(n-1))

公式:mean(平均数)+/-IQR*1.5给出范围。IQR=Q3-Q1。

假设一共有n 个数据。Q3=排序之后的第0.75n个值。Q1=排序之后的第0.25n个值

0 0