数据预处理 归一化

来源:互联网 发布:linux安装源码包 编辑:程序博客网 时间:2024/06/05 17:13

归一化是一种数据预处理方法,就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内,为了后面数据处理的方便,其次是保正程序运行时收敛加快

归一化的三种方法:

1、线性函数转换,表达式如下:

y=(x-MinValue)/(MaxValue-MinValue)
说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值。
2、对数函数转换,表达式如下:
y=log10(x)
说明:以10为底的对数函数转换。
3、反余切函数转换,表达式如下:

y=atan(x)*2/PI


归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算,首先基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的,归一化是同一在0-1之间的统计概率分布;

0 0