图像处理中关于矩的解释

来源：互联网发布：电视网络机顶盒什么牌子的好编辑：程序博客网时间：2024/06/01 09:33

本文来自http://blog.csdn.net/dadaadao/article/details/6114989

不变矩的主要思想是使用对变换不敏感的基于区域的几个矩作为形状特征，Hu提出了7个这样的矩，在他工作的基础上出现了很多改进的版本。

图像的几何不变矩

矩特征主要表征了图像区域的几何特征,又称为几何矩，由于其具有旋转、平移、尺度等特性的不变特征，所以又称其为不变矩。

在图像处理中，几何不变矩可以作为一个重要的特征来表示物体，可以据此特征来对图像进行分类等操作。

1.HU矩几何矩是由Hu(Visual pattern recognition by momentinvariants)在1962年提出的，图像f(x，y)的(p+q)阶几何矩定义为 Mpq=∫∫(x^p)*(y^q)f(x，y)dxdy(p，q = 0，1，……∞）

矩在统计学中被用来反映随机变量的分布情况，推广到力学中，它被用作刻画空间物体的质量分布。同样的道理，如果我们将图像的灰度值看作是一个二维或三维的密度分布函数，那么矩方法即可用于图像分析领域并用作图像特征的提取。最常用的，物体的零阶矩表示了图像的“质量”：Moo=∫∫f(x，y )dxdy 一阶矩(M01，M10)用于确定图像质心( Xc，Yc)：Xc =M10/M00;Yc = M01/M00;若将坐标原点移至Xc和 Yc处，就得到了对于图像位移不变的中心矩。如Upq=∫∫[(x-Xc)^p]*[(y-Yc)^q]f(x，y)dxdy。

Hu在文中提出了7个几何矩的不变量，这些不变量满足于图像平移、伸缩和旋转不变。

如果定义Zpq=Upq/(U20 + U02)^(p+q+2)，Hu的7种矩为：H1=Z20+Z02;H1=(Z20+Z02)^2+4Z11^2;......

2.Zernike矩在模式识别中,一个重要的问题是对目标的方向性变化也能进行识别。Zernike矩是一组正交矩,具有旋转不变性的特性,即旋转目标并不改变其模值。。由于Zernike 矩可以构造任意高阶矩,所以Zernike矩的识别效果优于其他方法.

Zernike 提出了一组多项式{ V nm ( x , y) } 。这组多项式在单位圆{ x2 + y2 ≤1}内是正交的,具有如下形式: V nm ( x , y) = V nm (ρ,θ) = Rnm (ρ) exp ( jmθ),并且满足 ∫∫ x^2+y^2 <= 1 [( Vnm ( x , y) 的共轭]* V pq ( x , y) d x dy. = [pi/(n+1)]*δnpδmq .

if(a==b) δab = 1 else δab = 0，n 表示正整数或是0；m是正整数或是负整数它表示满足m的绝对值<=n而且n-m的绝对值是偶数这两个条件；ρ 表示原点到象素（x，y）的向量的距离；θ 表示向量ρ 跟x轴之间的夹角（逆时针方向）.

对于一幅数字图象,积分用求和代替,即A nm =∑x∑y f(x,y) *[( V nm (ρ,θ) 的共轭],x^2+y^2<=1,实际计算一幅给定图象的Zernike矩时,必须将图象的重心移到坐标圆点,将图象象素点映射到单位圆内。由以上可知,使[ V nm (ρ,θ) 的共轭]可提取图象的特征,低频特性由n 值小的[( V nm(ρ,θ) 的共轭]来提取,高频特性由n值大的来提取。Zernike 矩可以任意构造高价矩, 而高阶矩包含更多的图象信息, 所以Zernike矩识别效果更好。,Zernike 矩仅仅具有相位的移动。它的模值保持不变。所以可以将| A nm | 作为目标的旋转不变性特征。因为|A nm | =| A n , - m | ,所以只需计算m ≥0 的情况。

以下转自http://blog.csdn.net/byxdaz/archive/2009/12/28/5089448.aspx

图像的几何不变矩

矩特征主要表征了图像区域的几何特征,又称为几何矩，由于其具有旋转、平移、尺度等特性的不变特征，所以又称其为不变矩。在图像处理中，几何不变矩可以作为一个重要的特征来表示物体，可以据此特征来对图像进行分类等操作。如果想详细了解不变矩的概念、公式等请参考下面的论文：

不变矩方法研究

一种实用的不变矩计算方法

http://download.csdn.net/source/1943495

1. HU矩

几何矩是由Hu(Visual pattern recognition by momentinvariants)在1962年提出的，图像f(x，y)的(p+q)阶几何矩定义为

Mpq =∫∫(x^p)*(y^q)f(x，y)dxdy(p，q = 0，1，……∞）

矩在统计学中被用来反映随机变量的分布情况，推广到力学中，它被用作刻画空间物体的质量分布。同样的道理，如果我们将图像的灰度值看作是一个二维或三维的密度分布函数，那么矩方法即可用于图像分析领域并用作图像特征的提取。最常用的，物体的零阶矩表示了图像的“质量”：

Moo= ∫∫f(x，y )dxdy

一阶矩(M01，M10)用于确定图像质心( Xc，Yc)：

Xc = M10/M00;Yc = M01/M00;

若将坐标原点移至 Xc和 Yc处，就得到了对于图像位移不变的中心矩。如

Upq =∫∫[(x-Xc)^p]*[(y-Yc)^q]f(x，y)dxdy。

Hu在文中提出了7个几何矩的不变量，这些不变量满足于图像平移、伸缩和旋转不变。如果定义

Zpq=Upq/(U20 + U02)^(p+q+2)，

Hu 的7种矩为：

H1=Z20+Z02;H1=(Z20+Z02)^2+4Z11^2;......

矩是描述图像特征的算子，它在模式识别与图像分析领域中有重要的应用．迄今为止，常见的矩描述子可以分为以下几种：几何矩、正交矩、复数矩和旋转矩．其中几何矩提出的时间最早且形式简单，对它的研究最为充分。几何矩对简单图像有一定的描述能力，他虽然在区分度上不如其他三种矩，但与其他几种算子比较起来，他极其的简单，一般只需用一个数字就可表达。所以，一般我们是用来做大粒度的区分，用来过滤显然不相关的文档。

比如在图形库中，可能有100万幅图，也许只有200幅图是我们想要的。使用一维的几何矩的话，就可以对几何矩进行排序，建立索引，然后选出与目标图的几何矩最近的2000幅图作比较就好了。而对于其他的矩来说，由于一般是多维的关系，一般不好排序，只能顺序查找，自然速度有巨大的差别.所以。虽然几何矩不太能选出最像的，但可以快速排除不像的，提高搜索效率。

几种简单的几何矩：

令平面上点坐标为P(x,y),重心为C(x!,y!),

二阶行距：rowMoment = [∑（x- x!）*（x- x!）]/A

二阶列距：colMoment = [∑（y- y!）*（y- y!）]/A

A为点的个数。

由以上两个信息可以算出图形的圆度：circleDisgree = rowMoment /colMoment.如果图形的circleDisgree 越小于1，则它越趋向于长轴为y方向的椭圆。如果图形的circleDisgree越大于1，则它越趋向于长轴为x方向的椭圆.如果图形的circleDisgree 越接近于1，则它越趋向于圆。

所以我们可以使用圆度这种几何矩，对其进行索引，实现快速过滤。

2.Zernike矩

在模式识别中,一个重要的问题是对目标的方向性变化也能进行识别。Zernike矩是一组正交矩,具有旋转不变性的特性,即旋转目标并不改变其模值。。由于Zernike 矩可以构造任意高阶矩,所以Zernike矩的识别效果优于其他方法.

Zernike 提出了一组多项式{ V nm ( x , y) } 。这组多项式在单位圆{ x2 + y2 ≤1}内是正交的,具有如下形式: V nm ( x , y) = V nm (ρ,θ) = Rnm (ρ) exp ( jmθ),并且满足 ∫∫ x^2+y^2 <=1 [( V nm ( x , y) 的共轭]* V pq ( x , y) d x dy. = [pi/(n+1)]*δnpδmq .

if(a==b) δab = 1 else δab = 0，n表示正整数或是0；m是正整数或是负整数它表示满足m的绝对值<=n 而且n-m的绝对值是偶数这两个条件；ρ表示原点到象素（x，y）的向量的距离；θ 表示向量ρ 跟x 轴之间的夹角（逆时针方向）.

对于一幅数字图象,积分用求和代替,即A nm =∑x∑y f(x,y) *[( V nm (ρ,θ) 的共轭],x^2+y^2<=1

实际计算一幅给定图象的Zernike 矩时,必须将图象的重心移到坐标圆点,将图象象素点映射到单位圆内。由以上可知,使[ V nm(ρ,θ) 的共轭]可提取图象的特征,低频特性由n 值小的[( V nm (ρ,θ) 的共轭]来提取,高频特性由n值大的来提取。Zernike 矩可以任意构造高价矩, 而高阶矩包含更多的图象信息, 所以Zernike矩识别效果更好。,Zernike 矩仅仅具有相位的移动。

它的模值保持不变。所以可以将| A nm | 作为目标的旋转不变性特征。因为| A nm | =| A n , - m |,所以只需计算m ≥0 的情况。

不变矩的应用过程一般包括：1）选择合适的不变矩类型；2）选择分类器（如神经网络、最短距离等）；3）如果是神经网络分类器，则需要计算学习样例的不变矩去训练神经网络；4）计算待识别对象的不变矩，输入神经网络就可得到待识别对象的类型，或者计算待识别对象不变矩与类别对象不变矩之间的距离，选择最短距离的类别作为待识别对象的类别。

可以看出，不变矩作用主要目的是描述事物（图像）的特征。人眼识别图像的特征往往又表现为“求和”的形式，因此不变矩是对图像元素进行了积分操作。

不变矩能够描述图像整体特征就是因为它具有平移不变形、比例不变性和旋转不变性等性质。

然而，另一方面图像的各阶不变矩究竟代表的什么特征很难进行直观的物理解释。

0 0