图像处理书籍笔记1--图像基本数据结构

来源:互联网 发布:网络凶杀2 编辑:程序博客网 时间:2024/06/01 22:56

计算机视觉的目的是寻找输入图像与真实世界之间的关系。由原始图像向模型的转换过程,图像信息逐渐压缩。在输入图像和模型之间,定义若干层次的视觉信息表示,计算机视觉由以下设计所组成:

1.中间表示(数据结构)。

2.创建这些中间表示所用的算法和它们之间关系的导入(算法)。

中间层一般可以表示成四个层次。按照从处于低层次抽象的信号开始到人能够感知的描述的顺序排列。

第一层:最低层的表示,称为图标图像,有原始的像素亮度数据的整数矩阵构成。为了后续图像处理,需要进行预处理(如:滤波或边缘锐化)

第二层:分割图像,图像被分割为可能属于同一物体的区域。

第三层:几何表示,保存2D和3D形状知识。例如,在做普通而复杂的有关实际物体受光照和运动影响的模拟时,几何表示是有用的。

第四层:图像数据表示的关系模型。涉及AI技术,利用一些先验知识,从图像中获得的信息可以表示成语义网络或框架。

传统图像图像数据结构

传统的数据结构有矩阵、链、图、物体属性表、关系数据库,这不仅直接表示图像重要的信息,而且还是更复杂的图像分层表示方法的基础。

矩阵:低层图像表示的最普通的数据结构,矩阵是图像的一个完整表示,与图像数据的内容无关,它隐含这图像组成部分之间的空间关系,这些图像组成部分在语义上具有重要性。在图像中,一个很重要的空间关系是相邻关系。矩阵中有大量的图像数据,因此需要大量的空间,因此如果首先从原始的图像矩阵得出全局信息,可以使算法上加速。两个比较好的全局信息的例子:直方图(一个图像的像素具有某个亮度的概率统计),共生矩阵(具有描述纹理的能力)。

            积分图像是另一种能够描述全局信息的矩阵表示方法。积分图像的构造方式是位置(i,j)处的值ii(i,j)是原图像(i,j)左上角所有像素的和。计算多个尺度的简单矩形图像特征,能够快速的在目标识别和目标跟踪上。

链:在计算机视觉中用于描述物体的边界。链适合组织成符号序列的数据,链中相邻的符号通常对应于图像中邻接的基元。有两种常用的编码方式:链码和行程编码。

拓扑数据结构:将图像描述成一组元素及其相互关系,这些关系通常用图结构来表示。区域图和区域邻接图。

关系结构: 关系数据库也可以用来表示从图像中得到的信息。

分层数据结构  ——  由于计算机视觉需要巨大的数据量,分层数据结构使一些特殊算法成为可能,这些算法在相对小的数据量的基础上决定处理策略。

金字塔:最简单的分层数据结构,有两种:M型金字塔(矩阵型金字塔)和T型金字塔(树形金字塔)。


1 0