規范化(標准化)數據的3種方法

来源:互联网 发布:win10上安装mac虚拟机 编辑:程序博客网 时间:2024/05/20 10:13

http://blog.csdn.net/Meoop/article/details/40931731


令A是數值屬性,具有n個觀測值 。      

    1、  最小—最大規范化
    最小—最大規范化對原始數據進行線性變換。假設和分別為屬性A的最大值和最小值。最小—最大規范化通過計算:

    把A的值映射到區間中
    最小—最大規范化保持原始數據值之間的聯系,但是如果今後的輸入實例落在A的原數據值域之外,則該方法將面臨「越界」錯誤。
 
    2、  z分數(z-score)規范化(或零均值規范化)
    在z分數規范化中,屬性A的值基於A的均值和標准差規范化。A的值被規范化為,由以下公式計算:

其中分別為屬性A的平均值和標准差。
    當屬性A的實際最小值和最大值未知,或者離群點左右了最小—最大規范化時,該方法是有效的。
 
    3、小數定標規范化
    小數定標規范化通過移動屬性A的值的小數點位置進行規范化。小數點的移動位數依賴於A的最大絕對值。A的值被規范化為,由下式計算:

其中,j是使得的最小整數。

0 0
原创粉丝点击