[论文复现]Detecting Text in Natural Image with Connectionist Text Proposal Network
来源:互联网 发布:文件夹共享设置软件 编辑:程序博客网 时间:2024/05/21 10:50
本文转载自:
http://blog.csdn.net/peaceinmind/article/details/53215090
最近一直在复现这篇论文,除了数据外已基本完成,可是没想到昨天开源了[code],只能说我等水货赶不上开源的速度,但是又不开源数据,然后默默地发现,做深度学习这等东西,代码不重要,重要的是数据,以后说不定就有数据商店了。现附上个人的一些中间结果(只训练了200多张图片,网络架构,参数等跟作者的有些出入),然后来说说这篇论文。
为什么只是说说这篇论文还不是分析这边论文,主要是这篇论文真是比较简单,如果比较清楚RPN,基本没什么说的。论文的思想主要借鉴了faster rcnn的rpn思想,主要的不同点在于作者观测到RPN比较难预测出整个文本行的框,而将文本行分成一个一个的小框去预测,小框是固定宽度所以主要是预测高度,如果用的是VGG conv5的特征,那么高度就是16。(另外插一个小知识点,本人以前也错过,卷积层的size和pool层的数量没关系,跟stride有关系)
第二点是加入了双向LSTM,本人还没有分析到双向LSTM具体的作用有多少,因为在其他论文中不需要双向LSTM,依靠感受野也能分析出来。最后一个小不同就是为了精确定位加入了side regression。
问题:
1没有很好地处理多方向的文本行
2训练的时候由于有regression和LSTM,需要小心控制梯度爆炸。
2017/2/15更新
根据作者提供的测试代码重新修改了训练代码(发现自己写的跟作者的还是有比较大的差距的),加入了side refinement,数据方面自己标注了2000多张图片,最后的训练效果肯定跟作者的有出入
另外个人感觉作者将一个文本行分解成一个一个小块来做是比较实用的策略,降低了特征空间,又不会像另外一篇论文那种使用像素级labeling把问题搞得非常复杂
- [论文复现]Detecting Text in Natural Image with Connectionist Text Proposal Network
- [论文复现]Detecting Text in Natural Image with Connectionist Text Proposal Network
- Detecting Text in Natural Image with Connectionist Text Proposal Network
- Detecting Text in Natural Image with Connectionist Text Proposal Network论文笔记
- ctpn-Detecting Text in Natural Image with Connectionist Text Proposal Network 论文解读
- CTPN: Detecting Text in Natural Image with Connectionist Text Proposal Network
- 【ECCV2016】Detecting Text in Natural Image with Connectionist Text Proposal Network
- 【aixiv2016】DeepText A Unified Framework for Text Proposal Generation and Text Detection in Natural I
- 论文阅读:Synthetic Data for Text Localisation in Natural Images
- 论文阅读:Synthetic Data for Text Localisation in Natural Images
- 论文笔记-Synthetic Data for Text Localisation in Natural Images
- SegLink on github-Detecting Oriented Text in Natural Images by Linking Segments
- 对论文Synthetic Data for Text Localisation in Natural Images的理解
- 论文笔记之Synthetic Data for Text Localisation in Natural Images(人工合成带有文本的图片)
- 论文笔记:TextBoxes: A Fast Text Detector with a Single Deep Neural Network
- [论文笔记]TextBoxes A Fast Text Detector with a Single Deep Neural Network
- (Paper)Robust Text Detection in Natural Scene Images
- Symmetry-Based Text Line Detection in Natural Scenes
- mysql
- JAVA序列化 框架 Kryo
- redis技术点
- redis-类型操作
- WebP 探寻之路
- [论文复现]Detecting Text in Natural Image with Connectionist Text Proposal Network
- 从MVC框架看MVC架构的设计
- 【设计模式】六大原则
- 06_02 学生毕业离校手续
- 第二章上机练习
- mac下更新自带的PHP版本到5.6或7.0
- cpu性能测试代码
- iOS开发中,调整view层级位置的两个属性
- SQL 高级 第三章 SQL编程