文章标题

来源:互联网 发布:腾讯微云网盘for mac 编辑:程序博客网 时间:2024/05/02 01:17

文档OCR-文字区域定位 (Edge Boxes)

标签:document_processing


  《Edge Boxes: Locating Object Proposals from Edges》是ECCV2014的一篇关于目标检测的一篇文章,作者是来自于MSRA的 Piotr 等人。本文并没有涉及到“机器学习”,反之采用的是最原始的图像处理方法,因为现在很多提取proposals的文献,例如BING等,都是基于学习的方法。此外,本文的许多内容,甚至数学公式,都是基于作者的直觉直接建立。一篇学术paper,一般由研究目标,研究方法和实验结论组成,以下部分分别从这几方面进行介绍。
  作者为了加速现有目标检测算法,提出了一种能够以较高精度确定proposal的新方法。至于proposal 还没有一个确定的中文翻译,一般被称作“目标可能位置”。这个概念非常重要,当我们看到一幅图像的时候,我们绝对不会像传统检测算法那样去遍历图像,而是一眼“纵观全局”,直接发现目标“大概的位置”,然后进一步细看。
  这篇文章确定 proposal 的方法的可贵之处就是进一步挖掘了图像更原始更本质的内容。显而易见,这样的方式,速度会很快。
  Pioter 的研究方法:利用边缘信息(Edge),确定bounding box 内的轮廓个数和与 box 边缘重叠的轮廓个数(这点很重要,如果我能够明确一个box内包含的轮廓个数,那么目标有很大可能性就在这个框中,这也是作者的直觉),并基于此对框框进行评分,进一步根据得分的高低顺序确定proposal信息(由大小,长宽比,位置构成)。而后续工作就是在proposal内部运行相关检测算法。
下面试着详细介绍本文算法流程。

a(Si,Sj)=|cos(θiθij)cos(θjθij)|γ

0 0