归一化的说明

来源：互联网发布：输入法linux版编辑：程序博客网时间：2024/06/05 18:59

归一化是在实现算法时经常使用的操作。本文的目的是说明归一化的作用。

归一化是一种简化计算的方式，即将有量纲的表达式，经过变换，化为无量纲的表达式，成为标量。在多种计算中都经常用到这种方法（百度百科）。

假设有一组数列，或者说向量（1,2,3,4）

一、使用无穷范数归一化

无穷范数是指这组数列中最大的数，即4，归一化后结果为（1/4,2/4,3/4,4/4）。

假设（1,2,3,4）是某国不同阶层人均月收入，而(3,4,6,8)是另一国不同阶层的人均月收入。比较两国的贫富差距，一种方法是4-1=3,8-3=5，得出绝对贫富差分别为3和5.另一种方法是使用无穷级数进行归一化，得出其他阶层相对最高收入阶层的收入占比1/4和3/8.

二、使用Frobenius范数归一化

Frobenius范数（也称2范数）是指这列数列的平方和再开根号，即

，归一化后结果为（1/4.96,2/4.96,3/4.96）。

当该数列为欧式空间中的向量或点时，可以使用该归一化方法，比如，在文本处理过程中，假设数列为某一文本中四个不同的词的计数结果，则可以使用该数列表示该文本。当另一文本包含同样的四个词汇时，可以得到另一个数列，比如（2,4,6,8）。显然，影响计数结果的一个重要因素是文本长度，因此为了消除文本长度对统计结果的影响，通常使用2范数进行归一化。

三、Frobenius范数的推广

2范数可以推广到任意范数的归一化，其一般计算方法为：

其中，当n=1时，是最常见的归一化方式——将数列归一化到0~1之间。

Ref. PDLN

0 0