[水水文]Fused Text Segmentation Networks for Multi-oriented Scene Text Detection
来源:互联网 发布:纺织英语翻译软件 编辑:程序博客网 时间:2024/05/22 15:39
FuseText是非常典型的一种工作模式,在一个经典的开源工程上,“借鉴”其他领域的最新成果,加上自己的一些东西然后“迁移”到自己的任务中。申明一下,本人没有任何不敬的意思,只要对科研和工程有益的工作都是值得尊敬的。
首先看下框架图,如果看了FPN和FCIS,就会一目了然。
它的架构主要依赖于FCIS,然后个人觉得加强的部分有两点:
1 加入了FPN的思想
2 在更高分辨率的feature map上进行分割。
另外从文字检测的结果上来看,在大量合成数据和Resnet101的加持下,取得了很好的性能,速度方面也能接受,4个FPS.
缺点方面,由于个人做了一段时间scene text的工作,就不负责任地评价下,很有可能不对。
1 文字检测的最终目的还是为了识别,但是不同于物体,文字的框如果定位不准那么识别基本上也不会准,比如911,只框住了91,那能识别对么。 Box regression的缺点在于它的复杂度很高,很多东西需要人工精心设计,比如anchor,损失函数等,所以基本上很难得到比较完美的框,特别是对整行文字进行regression,当然现在很多的其他方法都有这样的问题。整行地做回归是我最不看好的,虽然按照目前的评价标准没什么问题。可以看下图,也是论文放出来的图,有明显的框不全情况。如果用这种框去做识别,也许只能用word classifier这种方式。但是这种方式有明显的缺点,不能识别不在字典的单词,比如数字等。
阅读全文
0 0
- [水水文]Fused Text Segmentation Networks for Multi-oriented Scene Text Detection
- 【论文阅读】Fused Text Segmentation Network for Multi-oriented Scene Text Detection
- 【论文笔记】 Arbitrary-Oriented Scene Text Detection via Rotation Proposals
- 论文笔记-Arbitrary-Oriented Scene Text Detection via Rotation Proposals
- [论文笔记]Arbitrary-Oriented Scene Text Detection via Rotation Proposals
- Deep Matching Prior Network: Toward Tighter Multi-oriented Text Detection
- [水水文]Feature Pyramid Networks for Object Detection
- A Novel Text Structure Feature Extractor for Chinese Scene Text Detection and Recognition论文笔记
- 论文阅读-《Deep Matching Prior Network:Towards Tighter Multi-oriented Text Detection》
- Deep Matching Prior Network: Toward Tighter Multi-oriented Text Detection 论文笔记
- [水文]EAST: An Efficient and Accurate Scene Text Detector
- 【论文笔记】 R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection
- (Paper)Robust Text Detection in Natural Scene Images
- ICDAR Focused Scene Text Detection任务的数据集
- (Paper)Robust Text Detection in Natural Scene Images
- RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation
- WPF: Creation of Text Labels for 3D Scene
- Region-based Discriminative feature pooling for scene text recognition (CVPR14)
- 12月的音乐可视化笔记:我从TOP2000歌曲中,分析了这几年流行音乐的变化趋势
- Qt之读(解析)XML文件
- iOS 获取view上某一点的色值
- centos7 配置静态ip
- 结束8080端口占用
- [水水文]Fused Text Segmentation Networks for Multi-oriented Scene Text Detection
- Linux 内核测试和调试(5)
- 关于Spring中的<task:annotation-driven/>配置
- R语言 天猫评论爬虫_new
- AI 崛起,科学家的天下,程序员的谢幕
- Fragment界面缓存问题
- 十位值得关注的Java顶级专家
- 341. Flatten Nested List Iterator
- cant connect to mysql server on localhost(10038)