程序博客网 > 科比3d模型数据

CTPN: Detecting Text in Natural Image with Connectionist Text Proposal Network

来源：互联网发布：科比3d模型数据编辑：程序博客网时间：2024/06/08 14:36

paper
code

1. 区别

本文工作基于faster RCNN , 区别在于

改进了rpn，anchor产生的window的宽度固定为3。
rpn后面不是直接接全连接+分类/回归，而是再通过一个LSTM，再接全连接层。
坐标仅仅回归一个y，而不是x1, y1, x2, y2
添加 side-refinement offsets（可能这个就是4个回归值中的其中2个）

2. 问题分析

文字目标的特殊性，一个很大的先验是，文字总是水平排列的。
文字的特征总感觉体现在edge上。
自然场景文字检测的难点在于：小目标，遮挡，仿射畸变。本文使用VGG16，只使用conv5，可能对小文字的检测效果不好。

3. 实验

CTPN用在ICDAR2017中文检测数据集上的结果：AP=0.18

1．检测准确率和目标大小的关系

图1

图2

图1、2是目标重叠率和目框面积的关系，其中图1是手工标记框和预测框的重叠率，纵坐标低于0.5表示漏检测；图2是预测框和手工标记框的重叠率，纵坐标低于0.5表示错检测。

当目标比较小时，漏检测和误检测的数量比较多。图片如下：

2．检测准确率和目标长宽比的关系

图3

图4

图3、4分别是重叠率和目标长宽比的关系。图3的横坐标是手工标记的目标长宽比，最大能到20，图4的横坐标最大只有1（anchor的限制）。该算法对于垂直排列的中文汉字，识别率很低（毕竟只是针对英文文字的检测，英文字母只有水平排列）这是这个算法本身的限制所在。

0 0

科比3d模型数据

科比3d模型数据

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子貔貅能佩戴吗观音玉坠佩戴讲究怀表怎么佩戴貔貅项链的佩戴方法珍珠手链佩戴佩带 peidai 配戴玉髓可以长期佩戴吗 24小时心电图佩戴图片属虎的人适合佩戴什么属马的人适合佩戴什么属猴的人适合佩戴什么隐形眼镜怎样佩戴隐形眼镜怎么佩戴双貔貅手链的佩戴方法度母适合什么人佩戴蜜蜡不适合什么人佩戴金曜石哪些人不能佩戴蜜蜡适合什么人佩戴黑曜石貔貅手链的佩戴方法李佩斯布达佩斯洛佩斯超级洛佩斯佩斯佩斯塔罗宾洛佩斯小猪佩斯李佩斯出柜李佩斯图片李佩斯吧李佩斯女装肯佩斯布达佩斯大饭店布达佩斯小酒馆布达佩斯之恋超级洛佩斯免费高清观看李佩斯精灵王佩德罗洛佩斯佩斯卡拉足球俱乐部