边缘文本检测:快速的和健壮的场景文本定位算法的研究
来源:互联网 发布:经知考试网网址 编辑:程序博客网 时间:2024/06/04 16:10
论文原文:http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7780757
该论文的目标任务是什么?
做边缘文本检测,快速的和健壮的场景文本定位算法的研究,为文字识别提供定位的算法
1. 应用场景是什么?
文字识别体系中,不同中场景,不同种文字的快速准确定位。
实际的生活应用包括:图像与视频检索、多国语言翻译、自动助理等
2. 现存的问题瓶颈?
文中未具体提及
3. 已有最佳方法从哪些思路去解决的?
已有两个方案来解决文本定位问题:
1)使用滑动窗口去定位文本的位置,缺点是计算量特别大,并且会产生大量冗余的候选区域
2)使用连接组件分析(主要有SWT 和MSER),虽然在场景文本识别取得了较好的效果,但是回调率较低
4. 该论文的解决思路?
通过边缘检测的方法去实现文本的定位
5. 具体方法?
1)Input image
2)ERs after non-maximum suppression
3)Texts classified with high threshold
4)Text classified with lowthreshold
5)Hysterrsis based tracked texts
6)Get results
6. 还存在的问题?
首要的是算法运行的时间有待优化,齐次是精度有待提高,置信度较低
7. 该论文的解决思路能否用到其他什么任务中?
视频中文本的定位,可以研究视频中文本定位的相关算法
8.文字定位算法的判别标准?
1)回调 文本探测必须定位尽可能多的文本区域
2)精确性 探测的结果尽可能的不包含非文本区域
3)独一无二性 在操作上每一个被侦察到的字符应该仅仅被标记一次
4)简洁性 检测到的区域应该精确地定位到所符合的字符而没有额外的边界
{cho, myungchul.sung, bongjin.jun}@stradvision.com 作者们的邮箱,可以发送邮件寻求训练数据集
- 边缘文本检测:快速的和健壮的场景文本定位算法的研究
- 文本似性检测论文总结----面向科技项目申报文本相似性检测算法的研究与应用
- 基于DM642的图像边缘检测算法的研究
- 基于KNN算法的文本分类研究
- 求海量文本中两两相似文本的快速算法
- 自然场景文本识别:基于笔画宽度变换的文本检测
- 自然场景文本识别:基于笔画宽度变换的文本检测
- vs对文本的检测和读取
- 关于位图边缘的检测定位
- 巧用键盘快速定位选定的Word文本
- 检测图像边缘(包括障碍物的边缘,道路边缘)算法
- python检测文本的字符编码快速方法
- 基于SSD的图片文本检测及快速方法
- 中文文本相似度算法分析与研究之改进算法----一种结合文本主题网络构建和语义分析的文本相似计算方法
- 用jquery实现基于文本的搜索和定位功能
- 通过旋转候选框实现任意方向的场景文本检测
- 【转载】边缘检测算法的四个步骤
- 基于canny的边缘检测算法:
- 120行代码爬取电子书网站
- C语言使用系统声音制作很lou的音乐键盘
- 成语加减法
- TCP/IP-概述
- iOS开发UITableView篇:[self.tableView reloadData]执行时间过长问题解决历程
- 边缘文本检测:快速的和健壮的场景文本定位算法的研究
- JLINK指示灯不亮,无法下载程序
- 三角形的判定
- 套接字编程实现信息传输
- 大小写的替换
- linux服务器启动tomcat很慢解决方法
- ul li表格拖拽、吸附功能
- 【WEB】Web性能压力测试工具
- leetcode 183. Customers Who Never Order(SQL,嵌套查询)38