文章标题

来源：互联网发布：腾讯微云网盘for mac 编辑：程序博客网时间：2024/05/02 01:17

文档OCR-文字区域定位 (Edge Boxes)

标签：document_processing

《Edge Boxes: Locating Object Proposals from Edges》是ECCV2014的一篇关于目标检测的一篇文章，作者是来自于MSRA的 Piotr 等人。本文并没有涉及到“机器学习”，反之采用的是最原始的图像处理方法，因为现在很多提取proposals的文献，例如BING等，都是基于学习的方法。此外，本文的许多内容，甚至数学公式，都是基于作者的直觉直接建立。一篇学术paper，一般由研究目标，研究方法和实验结论组成，以下部分分别从这几方面进行介绍。
作者为了加速现有目标检测算法，提出了一种能够以较高精度确定proposal的新方法。至于proposal 还没有一个确定的中文翻译，一般被称作“目标可能位置”。这个概念非常重要，当我们看到一幅图像的时候，我们绝对不会像传统检测算法那样去遍历图像，而是一眼“纵观全局”，直接发现目标“大概的位置”，然后进一步细看。
这篇文章确定 proposal 的方法的可贵之处就是进一步挖掘了图像更原始更本质的内容。显而易见，这样的方式，速度会很快。
Pioter 的研究方法：利用边缘信息（Edge），确定bounding box 内的轮廓个数和与 box 边缘重叠的轮廓个数（这点很重要，如果我能够明确一个box内包含的轮廓个数，那么目标有很大可能性就在这个框中，这也是作者的直觉），并基于此对框框进行评分，进一步根据得分的高低顺序确定proposal信息（由大小，长宽比，位置构成）。而后续工作就是在proposal内部运行相关检测算法。
下面试着详细介绍本文算法流程。

a (S i, S j) = | c o s (θ i - θ i j) c o s (θ j - θ i j) | γ

0 0