数据预处理归一化

来源：互联网发布：linux安装源码包编辑：程序博客网时间：2024/06/05 17:13

归一化是一种数据预处理方法，就是要把你需要处理的数据经过处理后（通过某种算法）限制在你需要的一定范围内，为了后面数据处理的方便，其次是保正程序运行时收敛加快

归一化的三种方法：

1、线性函数转换，表达式如下：

y=(x-MinValue)/(MaxValue-MinValue)
说明：x、y分别为转换前、后的值，MaxValue、MinValue分别为样本的最大值和最小值。
2、对数函数转换，表达式如下：
y=log10(x)
说明：以10为底的对数函数转换。
3、反余切函数转换，表达式如下：

y=atan(x)*2/PI

归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布，归一化在-1--+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算，首先基本度量单位要同一，神经网络是以样本在事件中的统计分别几率来进行训练（概率计算）和预测的，归一化是同一在0-1之间的统计概率分布；

0 0

数据预处理 归一化

数据预处理归一化