笔记：图像分割算法之 Graph Cut

来源：互联网发布：统计分析软件r 编辑：程序博客网时间：2024/04/30 01:06

http://blog.csdn.net/zouxy09/article/details/8532111 > 感谢这篇文章的作者，让我了解了Graph Cut 的算法知识。

Graph Cut 与Grab Cut 都是基于图论得分割方法。另外OpenCV实现了Grab Cut。Graph cuts 是一种有用和流行的能量优化算法，在计算机视觉领域应用于前背景分割，立体视觉，抠图。此类问题与图的最小割问题相关联。
首先用一个无向图 G 表示要分割的图像，V和E分别是顶点（vertex）和边（edge）的集合。此处的Graph和普通的Graph稍有不同。Graph Cuts 图在普通图的基础上多了两个顶点，这两个顶点分别用符号“S”与“T”表示，统称为终端顶点。其他所有的顶点都必须和这两个顶点相连形成边集合中的一部分。所以Graph Cuts中有两个顶点，也有两种边。
第一种顶点和边：普通顶点对应于图像中的每个像素。每两个邻域顶点（对应于图像中每两个邻域像素）的连接就是一条边。这种边也叫n-links。第二种顶点和边是：除图像像素外，还有另外两个终端顶点，叫S（source：源点，取源头之意）和T（sink：汇点，取聚合之意）。每个普通顶点和这两个终端顶点之间都有连接，组成第二种边。这种边也叫t-links。
这里写图片描述
上图就是一个图像对应的s-t图，每个像素对应图中的一个相应定点，另外还有s和t两个顶点。上图有两种边，实线表示每个邻域普通顶点连接的边n-links，虚线表示每个普通顶点与s和t连接的边t-links。在前后景分割中，s一般表示前景目标，t一般表示背景。
图中每条边都有一个非负权值We，也可理解为cost（代价或者费用）。一个cut（割）就是图中边集合E的一个子集C，那这个割的cost（表示为|C|）就是边子集C的所有边的权值的总和。
Graph Cuts 中的Cuts是指这样的一个边集合，显然这些边集合包括了上边2种边，该集合中所有边的断开会导致残留“S”和“T”图的分开，所以就成为割。
当一个割使得它的边所有权值之和最小，那么就成为最小割，也就是图割的结果。福特.富克森定理表明，网路的最大流max flow与最小割min cut相等。所以由Boykov和Komogorov发明的max-flow/min-cut算法就可以用来获得s-t图的最小割。这个最小割把图像的前景像素集和背景像素集，那就相当于完成了图像分割。
也就是图中边的权值就决定了最后的分割结果，那么这些边的权值怎么确定呢？图像分割可以看成pixel labeling（像素标记）问题，目标（s-node）的label设为1，背景（t-node）的label设为0，这个过程可以通过最小化图割来最小化能量函数得到。那很明显，发生在目标和北京的边界处的cut就是我们想要的（相当于把图像中背景和目标连接的地方割开，那就相当于把其分割了）。同时，这时候能量也应该是最小的，假设整幅图像的标签label（每个像素的label）为L={l1,l2,l3..lp}其中l1i为0（背景）或者1（目标）那假设图像的分割为L时，图像的能量可以表示为： E(L)=aR(L)+B(L) 其中，R(L)为区域项，B(L)为边界项，而a就是区域项和边界项之间的重要因子，决定他们对能量的影响大小。如果a=0，则只考虑边界因素不考虑区域因素。E(L)表示的是权值，即损失函数，也叫能量函数，图割的目标就是优化能量函数使其值达到最小。
区域项：
这里写图片描述
其中Rp(lp)表示为像素p分配标签lp的惩罚，Rp(lp)能量项的权值可以通过比较像素p的灰度和给定的目标和前景的灰度直方图来获得，换句话说就是像素p属于标签lp的概率，我希望像素p分配为其概率最大的标签lp，这时候我们希望能量最小，所以一般取概率的负对数值，故t-link的权值如下：
Rp(1) = -ln Pr(Ip|’obj’)；
Rp(0) = -ln Pr(Ip|’bkg’)
由上面两个公式可以看到，当像素p的灰度值属于目标的概率Pr(Ip|’obj’)大于背景Pr(Ip|’bkg’)，那么Rp(1)就小于Rp(0)，也就是说当像素p更有可能属于目标时，将p归类为目标就会使能量R(L)小。那么，如果全部的像素都被正确划分为目标或者背景，那么这时候能量就是最小的。
这里写图片描述
其中，p和q为邻域像素，边界平滑项主要体现分割L的边界属性，B可以解析为像素p和q之间不连续的惩罚，一般来说如果p和q越相似（例如它们的灰度），那么B越大，如果他们非常不同，那么B就接近于0。换句话说，如果两邻域像素差别很小，那么它属于同一个目标或者同一背景的可能性就很大，如果他们的差别很大，那说明这两个像素很有可能处于目标和背景的边缘部分，则被分割开的可能性比较大，所以当两邻域像素差别越大，B越小，即能量越小。好了，现在我们来总结一下：我们目标是将一幅图像分为目标和背景两个不相交的部分，我们运用图分割技术来实现。首先，图由顶点和边来组成，边有权值。那我们需要构建一个图，这个图有两类顶点，两类边和两类权值。
普通顶点由图像每个像素组成，然后每两个邻域像素之间存在一条边，它的权值由上面说的“边界平滑能量项”来决定。还有两个终端顶点s（目标）和t（背景），每个普通顶点和s都存在连接，也就是边，边的权值由“区域能量项”Rp(1)来决定，每个普通顶点和t连接的边的权值由“区域能量项”Rp(0)来决定。这样所有边的权值就可以确定了，也就是图就确定了。这时候，就可以通过min cut算法来找到最小的割，这个min cut就是权值和最小的边的集合，这些边的断开恰好可以使目标和背景被分割开，也就是min cut对应于能量的最小化。而min cut和图的max flow是等效的，故可以通过max flow算法来找到s-t图的min cut。
目前的算法主要有：
1)Goldberg-Tarjan
2)Ford-Fulkerson
3)上诉两种方法的改进算法
这里写图片描述

0 0